Печать

О компьютерной лингвистике

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА -  направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.

К компьютерной лингвистике относят следующие области:

  • создание общих языков для представления информации;
  • усовершенствование языков для представления информации;
  • создание естественного языкового интерфейса для общения человека с машиной (одна из основных проблем Искусственного Интеллекта);
  • создание и моделирование информационных систем.

Сюда можно добавить наиболее важную область анализа текстовой информации, извлечения знаний, так как без этого невозможно спроектировать естественно-языковой интерфейс или создать универсальный способ представления информации.

В зависимости от решаемых задач используются различные методы анализа текста:

1. Статистические.

Статистические методы анализа текста могут быть использованы для решения различных задач компьютерной лингвистики: определение языка сообщения, установления авторства и классификации текстов, построения поисковых систем и т.д.

2. Лингвистические.

Лингвистические методы анализа текста опираются на этапы анализа текста, принятые в компьютерной лингвистике и сложившиеся на основе методов традиционной лингвистики, языкознания, герменевтики и других наук, занимающихся анализом текста и изучением законов человеческого мышления.

3. Комбинированные.

В некоторых системах более развиты лингвистические методы анализа текста, в других чаще применяются статистические методы. Бывают ситуации, когда использование обоих методов является целесообразным, т.к. с помощью лишь одного метода невозможно полностью выполнить поставленные задачи.

Travel Turne Tranzito