С середины XX века, в связи с прогрессом в разработке вычислительных устройств, наблюдается бурное развитие математических методов в теоретической лингвистике и ее приложениях, что неразрывно связано с дискретным представлением данных и средствами манипулирования ими. Содержание дисциплины охватывает круг вопросов, связанных с базовыми дискретными математическими моделями, аналитическими методами исследования и алгоритмами их обработки.
В настоящее время происходит активизация в области исследования лингвистических проблем формальными методами и в области применения для этих целей компьютеров. В области формализации естественных языков и создании систем автоматической обработки текстов задействовано большое количество людей и мощностей, работающих в самых разных направлениях. Это, прежде всего, связано с ростом производительности вычислительных систем, что позволяет в реальное время выполнять алгоритмы обработки текстов, которые раньше выполнить в реальное время было невозможно. Можно сказать, что увеличение вычислительных мощностей сделало возможным применение трудоемких лингвистических алгоритмов на больших объемах данных. Например, одним из привлекательных направлений являются исследования, в которых предпринимаются попытки формализации семантических понятий, в том числе, понятия смысла текста. Результаты такого рода исследований могут быть применены в самых разных областях, начиная от фундаментальной лингвистики и до прикладных областей: в автоматизированных системах акцепции информации из текстов на естественном языке, интеллектуальных системах поиска информации в сети, при построении систем автоматического аннотирования, электронных переводчиков и словарей, систем безопасности, работающих с текстами на естественном языке.
При изучении алгоритмов особое внимание уделяется
оценке их сложности. Рассматривается несколько различных вычислительных моделей,
естественно возникающих при обработке данных и моделировании вычислительных
процессов. Дискретные математические модели и вычислительные устройства являются
важнейшей областью исследований современной математики, индустриальной и
общественной деятельности. Это требует привлечения сложных моделей и методов
анализа из разных областей математики: комбинаторика, теория графов, теория
булевых функций и др.
Кроме того, важно не просто установить наличие или отсутствие (в различных смыслах) решения задачи, но и предъявить алгоритмический способ отыскания его в первом случае или некоторого его приближения во втором, а также оценить эффективность процедуры поиска решения. Размеры реальных задач, встречающиеся на практике, огромны, а значит решать их без использования вычислительной техники невозможно и умение разрабатывать и оценивать свойства алгоритмов является неотъемлемой частью профессиональной подготовки. Важно также отметить, что, хотя компьютеры классической фон Неймановской архитектуры являются наиболее доступными вычислительными средствами, важно иметь представление о различных моделях вычислений для наиболее адекватного и эффективного моделирования вычислительных процессов, возникающих при обработке того или иного вида информации.
- Преподаватель: Емельянов Павел Геннадьевич