![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Искусство, Культура, Литература
Литература, Лингвистика
Принцип аналогии в морфологии |
Принцип аналогии в морфологии В работе Белоногова Г. Г. и Зеленкова Ю. Г. описывается принцип построения алгоритма морфологического анализа текстов на основе принципа аналогии. Данный принцип используется в системах орфографического контроля русских текстов, системах автоматического индексирования документов и системах машинного перевода текстов с русского языка на английский и с английского языка на русский. Производительность программы на компьютере с процессором от 386 и выше составляет около 400 слов/с. При автоматической обработке текста возникает проблема “новых“ слов. Для синтаксического анализа и синтеза необходимо знать грамматические характеристики слов. Если слова в словаре нет, то морфологический анализ не может быть выполнен, а следовательно не могут быть определены грамматические характеристики слова. Для того, чтобы определить грамматические характеристики слов без словаря, Белоногов предложил принцип аналогии. Он основан на том, что существует сильная корреляционная связь между грамматическими характеристиками слов и буквенным составом их концов. Например: организация, приватизация, концентрация имеют ж. р., им. п. и ед. ч.; работают, понимают, привлекают - это глаголы в 3-ем лице мн. ч. и т. д. Принцип аналогии проверялся на ряде индоевропейских языков: (русский, болгарский, латышский, испанский, английский) и оказался эффективным. Сначала он применялся для определения грамматических характеристик слов, не включенных в машинный словарь. Затем возникла идея при проведении морфологического анализа отказаться от машинного словаря. Если по текстам большого объема составить словарь словоформ и назначить каждой словоформе некоторые грамматические признаки, а затем преобразовать данный словарь в обратный словарь словоформ, то можно обнаружить, что многие участки словаря имеют одинаковые наборы признаков. Обратный словарь словоформ представляет собой список словоформ с такими характеристиками как признак длинны грамматического окончания, номер флективного класса (типа словоизменения) и числовой индекс, характеризующий такие признаки как “глагольность“, “местоименность”, “сравнительная степень”. Например: масштаба 01/001/01 служба 01/056/01 возникшие 02/105/10 батальон 00/021/01 рассчитывая 00/152/10 Обратный словарь используется для автоматического морфологического анализа текстов, если составляющие их словоформы отождествлять со словоформами словаря и приписывать им грамматическую информацию, указанную в словаре. Словоформам текста, которые не находятся в словаре, можно приписывать грамматическую информацию тех словоформ словаря, концы которых в максимальной степени совпадают с концами этих новых словоформ текста. Объем обратного словаря можно сократить, если на всех его участках оставить по две словоформы: начальную и конечную. Более того из этих двух словоформ можно оставить только одну, и если словоформа текста не совпадет ни с одной словоформой обратного словаря, то ей приписывается информация непосредственно предшествующей словоформы этого словаря. Данный сокращенный словарь можно еще сократить, если исключить из него начальные буквы словоформ, не оказывающие влияние на результаты морфологического анализа.
При этом у каждой пары рядом стоящих словоформ оставляются справа совпадающие конечные буквосочетания и еще по одной букве, которые не совпадают. Например: аба 01/001/01 еба 01/044/01 неба 01/071/01 авшие 02/105/10 тальон 00/021/01 тывая 00/152/10 После выполнения всех операций объем словаря сокращается в 8 раз. На точность первоначально включенных в словарь словоформ это не повлияет, а точность анализа остальных словоформ русского языка будет достаточно высокой. Для морфологического анализа текстов на основе метода аналогии достаточно располагать обратным словарем концов слов. Но авторы разработки сделали еще “Словарь служебных и коротких слов”. В этот словарь были включены сначала предлоги, местоимения, частицы, союзы и короткие слова до 5 букв. Затем в него вошли также словоформы, которые по методу аналогии анализировались неверно. В результате этот словарь увеличился до 11 тысяч словоформ. Таким образом, в процессе морфологического анализа словоформы ищутся в словаре “Служебных и коротких слов”, а затем в словаре концов словоформ. Результаты анализа, полученные по первому словарю, считаются более надежными, и словоформы, найденные в этом словаре, дальнейшей обработке не подвергаются. В настоящее время вероятность правильного анализа слов при обработке текстов любой тематики превышает 99%. В разработке данной системы наряду с авторами данной статьи принимали участие научные сотрудники отдела лингвистических исследований ВИНИТИ: А. П. Новоселов, Е. Ю. Рыжова, С. А. Самоделкина, Ал-др А. Хорошилов, Ал-сей А. Хорошилов, Е. Г. Дружинина. Список литературы
Однако эти исследования в области точных наук не привели Фехнера к материалистическим заключениям [1]. В психологии он был параллелистом. Иными словами, он думал, что психические и физические феномены соответствуют друг другу способом, аналогичным отношению текста и его перевода или двух переводов одного текста, как он объяснял в своей "Зенд-Авесте" (1851) и "Элементах психофизики". По сути, психическое и физическое были для него двумя аспектами единой реальности. И в соответствии с этим представлением даже в растениях он постулировал присутствие психической жизни, хотя и более низкого типа, чем у животных [2]. Более того, он распространил этот параллелизм на планеты и звезды и по существу на все материальные вещи, оправдывая этот панпсихизм принципом аналогии, утверждающим, что когда объекты вместе обладают какими-то качествами или чертами, то можно гипотетически допустить, что они согласуются и в других качествах при условии, что наша гипотеза не противоречит установленным научным фактам. 1 В юности Фехнер прошел через увлечение атеизмом, но книга Окена, одного из учеников Шеллинга, убедила его, что материализм и атеизм никоим образом не следуют из признания точной науки. 2 В 1848 г
1. Принципы реализации машин БД
2. Принципы и методы организации коммерческой деятельности
3. Педагогическая помощь родителям в подготовке детей к школьному обучению
4. Психолингвистические аспекты речевой подготовки детей к школе
5. Принципы и методы формирования стратегии инвестиционного портфеля
9. Принципы и методы планирования
10. Влияние дополнительного занятия изобразительным искусством на подготовку детей к школе
11. Реализация методов эмоционально-ценностного компонента образования на уроках начальной школы
12. Занятия рисованием как средство подготовки детей к обучению в школе
13. принципы и методы отбора образцов, проб и выборок при исследовании свойств текстильных материалов
14. Вариативные формы подготовки детей к школе
15. Принципы и методы социальной работы, цели, задачи
16. Принцип полярографического метода
18. Принцип построения и опыт практической реализации экологических информационных систем
19. Подготовка к школе детей с задержкой психического развития (ЗПР)
21. Символдрама как метод коррекции тревожности у детей младшего школьного возраста
25. Численные методы и их реализация в Excel
26. Реализация принципа наглядности при изучении темы физики "Электромагнитные явления"
27. Принцип динамического баланса и его реализация в учебном процессе
28. Принципы формирования когнитивной установки жизни у детей
30. Проявление принципов арбитражного процесса в стадии подготовки дела к судебному разбирательству
31. Принципы формирования когнитивной установки жизни у детей
33. Подготовка к обучению грамоте детей с задержкой психического развития
35. Учетный цикл. Корректировочные записи как метод реализации правила соответствия
36. О выборе предприятий-аналогов для сравнительного метода оценки
41. Принципы, методы и концепции естественнонаучного познания
43. Стандарт-кост – зарубежный аналог нормативного метода учета затрат
44. Понятие, предмет, методы, принципы, нормы, источники и система налогового права
45. Предмет, метод, система и основные принципы трудового права
48. Реализация принципа свободы договора и осуществление его в предпринимательской деятельности
49. Нахождение корней уравнения методом Ньютона (ЛИСП-реализация)
50. Протоколы и методы реализации VPN сетей
52. Принципы питания здоровых и больных детей старшего взраста(старше 1 года)
53. Анализ опыта США в реализации принципов всеобщего управления качеством
57. Аналогии и модели - один из методов обучения физики средней школы
58. Использование метода проектов в процессе ознакомления детей 7 лет с немецкой культурой
59. Методы обучения и умственное развитие детей дошкольного возраста
60. Основні принципи та нетрадиційні методи викладання українського народознавства в школі
63. Принципы, методы и средства обучения с позиции православной педагогики
65. Формирование морфологической стороны речи у детей средней группы ДОУ
68. Обучение и реабилитация детей с нарушением слуха по верботональному методу
69. Сказкотерапия как методы психологической помощи детям в ситуации развода родителей
73. Основные методы реализации ЛРТУ
74. Принципы, средства и методы закаливания
75. Особенности, принципы, методы и структура управления природопользованием
76. Основные принципы и формы реализации социальной политики, ее влияние на экономику государства
77. Принципи і методи планування у виробничій сфері
79. Реактивные двигатели, устройство, принцип работы
80. Важнейшие достижения в освоении космоса
81. Освоение космоса
82. Освоение человеком космоса
83. Изучение миксомицетов среднего Урала, выращенных методом влажных камер
84. Методы исследования в цитологии
85. МЕТОДЫ ИЗУЧЕНИЯ ЭВОЛЮЦИИ ЧЕЛОВЕКА
90. Подготовка войск специального назначения в России
94. Роль рек в освоении и заселении Сибири
95. Освоение человеком труднодоступных территорий земли. Горы
96. Методы и модели демографических процессов
97. Гидрохимический, атмохический и биогеохимический методы поисков