Библиотека Рефераты Курсовые Дипломы Поиск
Библиотека Рефераты Курсовые Дипломы Поиск
сделать стартовой добавить в избранное
Кефирный гриб на сайте www.za4et.net.ru

Компьютеры, Программирование Компьютеры, Программирование

Основные способы обработки большого количества текстовой информации

Карабин, 6x60 мм.
Размеры: 6x60 мм. Материал: металл. Упаковка: блистер.
44 руб
Раздел: Карабины для ошейников и поводков
Чашка "Неваляшка".
Ваши дети во время приёма пищи вечно проливают что-то на ковёр и пол, пачкают руки, а Вы потом тратите уйму времени на выведение пятен с
222 руб
Раздел: Тарелки
Ночник-проектор "Звездное небо и планеты", фиолетовый.
Оригинальный светильник - ночник - проектор. Корпус поворачивается от руки. Источник света: 1) Лампочка (от карманных фонариков) 2) Три
330 руб
Раздел: Ночники

Санкт-Петербургский Государственный морской технический университет Факультет морского приборостроения. Кафедра САУ и БВТРЕФЕРАТ ПО ДИСЦИПЛИНЕ “ИНФОРМАТИКА” НА ТЕМУ: “Основные способы обработки большого количества текстовой информации”.Выполнил: студентка гр. 31ВМ1 (3111) Жаркова А.Н. Проверил: Д.Т.Н., профессор Жуков Ю.И. Санкт - Петербург 2000 г. АННОТАЦИЯ Реферат составлен на страницах. Содержит 2 рисунка, 3 таблицы и 2 приложения. Ключевые слова: адресация, автокоррекция, сжатие. Целью реферата является разработка и описание трех практических задач современной информатики: адресации элементов баз данных, множества или списка, для определения по первичному ключу местоположения элемента в блоке информации; автокоррекции языковых текстов для обнаружения и исправления ошибок в текстах; сжатии данных, для хранения данных в предельно компактной форме. СОДЕРЖАНИЕ АННОТАЦИЯ2 СОДЕРЖАНИЕ3 Введение4 ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ5 ВВЕДЕНИЕ5 1. Теоретическая часть5 1.1. Последовательное сканирование списка5 1. 2. Блочный поиск5 1.3. Двоичный поиск5 1.4. Индексно-последовательная организация6 1.5. Индексно-произвольная организация6 1.6. Адресация с помощью ключа, эквивалентного адресу7 1.7. Алгоритм преобразования ключа в адрес8 Выводы по части 1.10 ЧАСТЬ 2. АВТОКОРРЕКЦИЯ ТЕКСТА11 ВВЕДЕНИЕ11 1. Теоретическая часть11 1.1. Методы обнаружения ошибок11 1.2. Автоматизация процесса исправления11 1.3. Диалоговый и пакетный режимы12 Выводы по части 2.13 ЧАСТЬ 3. СЖАТИЕ ИНФОРМАЦИИ13 ВВЕДЕНИЕ13 Теоретическая часть13 1.1. Сжатие числовых данных13 1.2. Сжатие словарей13 1.3. Сжатие специальных текстов14 1.4. Сжатие структурированных данных15 1.5. Сжатие текстовой информации общего вида15 1.5.1. Адаптивные алгоритмы16 1.5.2. Статистические алгоритмы.16 1.5.2.1. Кодирование фрагментов фиксированной длины16 1.5.2.2. Кодирование фрагментов переменной длины17 Выводы по части 3.17 ПРИЛОЖЕНИЕ 1. Методы сжатия данных18 Метод Шеннона-Фано18 Метод Хаффмена 18 Заключение.20 Список литературы20 Введение Настоящий реферат состоит из трех самостоятельных частей, в которых излагаются три практические задачи современной информатики – адресация элементов данных линейного списка, автокоррекция естественно языковых текстов, сжатие данных. Они призваны, с одной стороны, для ознакомления с некоторыми практическими задачами информатики, а с другой – закрепить навыки прикладного программирования и составления блок-схем. Первая задача нашла свое применение в таких программных продуктах, как системы управления базами данных, операционные системы (организация поисковых операций в системных данных), компиляторы (работа с таблицами идентификаторов) и многих других. Алгоритмы адресации имеют универсальный характер и используются практически во всех задачах, в которых ведется организация и поиск информации в одномерных массивах, независимо от места ее нахождения – основная память или внешняя. Вторая задача носит более частный характер, а изложенные методы используются при проверке орфографии в текстовых и табличных процессорах, издательских системах, а также как средство верификации результатов работы сканера – после распознавания текста для устранения возможных ошибок выполняется его орфографический анализ.

Проблема сжатия данных решается в современных архиваторах. Они, как правило, используют комбинацию методов, изложенных в третьей части. Задачи программируются на языке программирования, который изучается в курсе «Алгоритмические языки и программирование», и, тем самым, закрепляют навыки, полученные в этой дисциплине. Кроме этого, требование подготовки блок-схем средствами Wi Word позволяет углубить знания, связанные, с одной стороны, с логическим проектированием алгоритма, а с другой – с правилами начертания блок-схем. Запрограммированные и отлаженные задачи должным образом оформляются, что также способствует умению правильно и аккуратно закреплять результат работы на бумажном носителе информации. ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ ВВЕДЕНИЕ Основную проблему при адресации элементов списков можно сформулиро­вать следующим образом: как по первичному ключу определить местоположение элемента с данным ключом (задача поиска)? Существует несколько различных спосо­бов адресации. Они рассматриваются далее. Иногда бывает необходимо объединить несколько полей, чтобы образовать уникальный ключ, называемый в этом случае сцепленным ключом: например, ключ, идентифициру­ющий студента в институте, является комбинацией номера группы, фамилии, имени и отчества студента (есть случаи, когда в од­ной группе учатся студенты с одинаковыми фамилиями и именами). Кроме простого и сцепленного, ключ может быть первичным – определять максимум один элемент в списке или вторичным – определять множество (в общем случае не одноэлементное) элементов в списке. Например, фамилия студента в учебной группе, как правило, является первичным ключом, а пол студента – вторичный ключ, поскольку одному значению этого ключа (мужской или женский) соответствует, в общем случае, группа студентов. 1. Теоретическая часть 1.1. Последовательное сканирование списка Наиболее простым способом локализации элемента списка является сканирование списка с проверкой ключа каждого элемента. Этот спо­соб, однако, требует слишком много времени для большинства применений. Он может быть эффективен только при пакетной обра­ботке последовательного файла, находящегося, например, на маг­нитной ленте, когда каждая запись все равно должна быть прочи­тана. 1. 2. Блочный поиск Если элементы упорядочены по ключу, то при сканировании списка не требуется чтение каждого элемента. Компьютер мог бы, напри­мер, просматривать каждый -ный элемент в последовательности возрастания ключей. При нахождении элемента с ключом, большим, чем ключ, используемый при поиске, просматриваются последние -1 элементов, которые были пропущены. Этот способ называется блочным поиском: элементы группируются в блоки, и каждый блок проверяется по одному разу до тех пор, пока ни будет найден нужный блок. Вычисление оптимального для блочного поиска раз­мера блока выполняется следующим образом: в списке, со­держащем элементов, число просмотренных элементов минимально при длине блока, равной  . При этом в среднем анализируется  элементов. 1.3. Двоичный поиск При двоичном поиске рассматривается элемент, находящийся в середине области, в которой выполняется поиск, и его ключ срав­нивается с поисковым ключом.

Затем поисковая область делится пополам, и процесс повторяется. При этом, если велико, то в среднем будет просмотрено примерно log2 -1 элементов. Это число меньше, чем число просмотров для случая блочного поиска. 1.4. Индексно-последовательная организация В общем случае сканирование (последовательный поиск) в списках для нахождения в них элемента является процессом, требую­щим много времени, если он выполняется над всем списком. Однако его можно использовать для точной локализации элемента в небольшой области, если эта область найдена некоторым другим способом. Если список упорядочен по ключам, то обычно при адресации используется таблица, называемая индексом. При обращении к таблице задается ключ искомого элемента, а результатом процедуры поиска в таблице является относительный или абсолютный адрес элемента. Индекс можно определить как таблицу, с которой связана процедура, воспринимающая на входе информацию о некоторых зна­чениях атрибутов и выдающая на выходе информацию, способствую­щую быстрой локализации элемента или элементов, которые имеют за­данные значения атрибутов. Индекс использует в качестве входной информации ключ и дает на выхо­де информацию, относящуюся к физическому адресу данного элемента. Если для адресации используется индекс, ЭВМ в ос­новном производит поиск в индексе, а не в списке. При этом существенно экономится время, но требуется память для хранения индекса. Это похоже на использование картотеки в библиотеке. Пользователь отыскивает название требуемой книги в картотеке и находит номер книги по каталогу, который является как бы отно­сительным адресом положения книги на полках. Если элементы списка упорядочены по ключу, индекс обычно со­держит не ссылки на каждый элемент, а ссылки на блоки элементов, внутри которых можно выполнить поиск или сканирование. Хранение ссылок на блоки элементов, а не на отдельные элементы в значительной степени уменьшает размер индекса. Причем да­же в этом случае индекс часто оказывается слишком большим для поиска и поэтому используется индекс индекса. В больших списках может быть больше двух уровней индекса. Для ускорения поиска сегменты нижнего уровня индекса мо­гут находиться среди данных, на которые они указывают. Например, в файле на диске обычно имеется на каждом цилиндре индекс дорожек, содержащий ссылки на записи, хранящиеся на этом цилиндре. Индексно-последовательные файлы представляют собой наибо­лее распространенную форму адресации файлов. 1.5. Индексно-произвольная организация Произвольный (непоследовательный) список можно индексиро­вать точно так же, как и последовательный список. Однако при этом требуется значительно больший по размерам индекс, так как он должен содержать по одному элементу для каждого элемента списка, а не для блока элемента. Более того, в нем должны содер­жаться полные абсолютные (или относительные) адреса, в то вре­мя как в индексе последовательного списка адреса могут содержаться в усеченном виде, так как старшие знаки последова­тельных адресов будут совпадать. По сравнению с произвольным доступом индексно-последовательный список более экономичен как с точки зрения размера индекса, так и с точки зрения времени, необходимого для поиска в нем.

Если штатные средства устройства не позволяют решить проблему, возможно, имеет смысл воспользоваться специализированной утилитой Psiloc Font Magnifier, которая навсегда избавит вас от подобных неудобств. Простой интуитивный интерфейс позволяет изменять размер экранных шрифтов в ту или другую сторону элементарным перемещением бегунка. Перед загрузкой приложения следует ознакомиться со списком поддерживаемых моделей смартфонов и инструкцией по установке. Наследникам Гиппократа ОС Windows Адрес www.makhaon.com Версия 10 1.2 Размер 2,5 Мбайт Интерфейс многоязычный Цена бесплатно Лицензия проприетарная (freeware) Чем больше мы познаем мир, тем больше недугов обнаруживаем, и справляться со всем этим сонмом хворей помогают компьютеры и специализированное ПОP- например, "Махаон МКБ". По сути, это система обработки визуальной и текстовой информации, получаемой с помощью диагностических и лечебных приборов. Для хранения и передачи данных используется формат DICOM, совместимый с большинством медицинских электронных устройств

1. Процессоры обработки текстовой информации

2. Обработка текстовой информации. Концепция электронного документа

3. Способы обработки экономической информации в анализе

4. Средства составления и изготовления текстовой информации - сканеры

5. Оценка финансового состояния предприятия и основные способы его оздоровления

6. Методика работы с текстовой информацией
7. Основные способы производства и последовательность их смены в истории человеческого общества
8. Основные способы защиты гражданских прав

9. Эффективная технология работы с растущими потоками несистематизированной текстовой информации

10. Профилактика травматического шока. Основные способы обезболивания

11. Применение слов, образованных графико-пунктуационным способом словообразования, в средствах массовой информации

12. Основные способы словообразования в современном английском языке

13. Требования к воспроизведению текстовой информации на экране

14. Принцип межпредметных связей при решении химических задач. Разбор основных способов решения расчетных задач

15. Статистические способы обработки экспериментальных данных

16. Механизация и автоматизация обработки информации по учету основных средств на предприятии

Рамочка тройная "Классика" (коричневая).
Тройная рамочка с отпечатком - это особый подход к созданию очаровательного подарка на память для этого особого периода жизни, с
2890 руб
Раздел: Мультирамки
Пазл "Стройка", 30 элементов.
Пазлы Ларсен - это прежде всего обучающие пазлы. Они привлекают прежде всего филигранностью исполнения. Сделанные из высококачественного
548 руб
Раздел: Пазлы (5-53 элементов)
Ручка-стилус шариковая "Людмила".
Перед Вами готовый подарок в стильной упаковке — шариковая ручка со стилусом. Она имеет прочный металлический корпус, а надпись нанесена с
415 руб
Раздел: Металлические ручки

17. Использование полей и закладок для оформления и автоматизации редактирования и обработки экономической информации в документах Word

18. Внешние устройства ПК. Функциональные возможности. Основные характеристики. Обмен информацией

19. Автоматизированная обработка информации (Шпаргалка)

20. Системы обработки информации - язык баз данных SQL со средствами поддержания целостности

21. Архитектура аппаратно-программных средств распределенной обработки информации для интранет-технологии

22. Использование полей и закладок для оформления и автоматизации редактирования и обработки экономической информации в документах Word
23. Обработка табличной информации с помощью сводных таблиц средствами MicroSoft Excel
24. Информационный процесс. Обработка информации

25. Особенности производственной программы, способов и режимов тепловой обработки, технологии приготовления блюд ресторана с немецкой кухней

26. Радиофизические методы обработки информации в народном хозяйстве

27. Обработка экономической информации средствами языка Pascal

28. Методы получения и обработки маркетинговой информации

29. Оценка влияния способов амортизации основных фондов на рационализацию денежных потоков производственной компании

30. Единство вещества, энергии и информацииосновной принцип существования живой материи

31. Образные методы запоминания текстовой и речевой информации

32. Автоматизированные Системы Обработки Информации

Набор для составления букета из мягких игрушек "LOVE", 3 зайки.
Яркий и нестандартный подарок - букет из мягких игрушек вызовет восторг у всех, независимо от возраста и положения. К тому же, этот букет
496 руб
Раздел: Дизайнерские игрушки
Именная кружка с надписью "Любимая бабушка".
Предлагаем вашему вниманию готовое решения для подарка по любому поводу – именная кружка. Кружка изготовлена из керамики, в нежной
434 руб
Раздел: Кружки
Ящик с крышкой Darel Box на колесах, 61x40x31 см.
Универсальные и герметичные боксы идеально подходят для хранения меха, одежды и домашнего текстиля. Герметичность конструкции обеспечивает
652 руб
Раздел: Более 10 литров

33. Основные этапы работы с информацией

34. Автоматизированные системы обработки экономической информации

35. Описание устройства сбора и первичной обработки информации о состоянии процесса бурения

36. Словарь специальных терминов по цифровой обработке информации

37. Высокоуровневые методы обработки информации и программирования

38. Автоматизированная система обработки экономической информации (АСОЭИ)
39. Web-серверы, базы данных в Интернет, Поиск информации в Интернет, Основные системы и средства
40. Возникновение науки кибернетика как способа хранения и переработки информации для принятия правильных управленческих решений

41. Защита информации. Основные методы защиты и их реализация

42. Обработка экономической информации в документах Word

43. Информация, информационные системы и экономические информационные системы: основные понятия и взаимосвязь

44. Групповой полет летательных аппаратов – алгоритм обработки информации относительного движения.

45. Автоматизированные системы обработки экономической информации

46. Основные подходы к первичной обработке биологического сырья. Сепарация, осаждение, экстракция

47. Эффективность освоения и основные направления совершенствования системы обработки почвы

48. Основные концепции бухгалтерской информации

Глобус Земли физико-политический, рельефный, с подсветкой, 320 мм.
Глобус Земли физико-политический, рельефный, с подсветкой, питание от сети. Диаметр: 32 см. Материал: пластмасса. Крым в составе РФ.
1452 руб
Раздел: Глобусы
Качели подвесные Edu-play "До-Ре-Ми".
Качели подвесные Edu Play "До-Ре-Ми". Легкие по весу, простые в сборке. Устанавливать возможно дома и на улице. Надежные канаты
2535 руб
Раздел: Качели
Фоторамка "Вращающийся куб".
Декоративная фоторамка, выполненная в виде куба. На гранях куба вы сможете разместить шесть фотографии формата 10 см х 10 см. Куб
330 руб
Раздел: Мультирамки

49. Учет и способы начисления амортизации основных средств

50. Автоматизированные системы обработки информации

51. Количество информации

52. Компьютерные технологии обработки экономической информации на основе использования систем управления базами данных

53. Обработка текстовых файлов

54. Основные понятия безопасности информации
55. Параллелизм как способ параллельной обработки данных
56. Поиск информации в Интернете по теме "Учет амортизации (износа) основных средств"

57. Представление текстовой и графической информации в электронном виде

58. Программы для обработки звуковой информации

59. Свойства информации. Единицы измерения количества информации

60. Текстовый редактор MS Word. Основные приемы, применяемые при создании текста

61. Числовая и нечисловая обработка информации

62. Графическая информация и средства ее обработки

63. Случайные величины и способы их описания. Основные понятия теории вероятности, применяемые при испытаниях РЭСИ

64. Основные формы первичной маркетинговой информации

Маркер выделитель текста Edding "E-345/6S", 6 цветов 1-5 мм.
Для выделения слов или текста в книгах, брошюрах, письмах и т.п. Практически для любой бумаги для копирования и факсов. Высокая
361 руб
Раздел: Текстовыделители
Кружка-хамелеон "Чеширский кот".
Вам нравятся необычные вещи? Любите удивляться и удивлять всех вокруг? Кружка-хамелеон "Чеширский кот" будет поднимать
304 руб
Раздел: Кружки
Насос ножной Phantom.
Количество цилиндров: 2. Суммарный рабочий объем цилиндров: 0,55 литра. Длина шланга: 0,55 м.
698 руб
Раздел: Насосы, компрессоры автомобильные

65. Методика изучения текстовых процессоров в основной школе

66. Основные методы сбора первичной социальной информации

67. Аналитическая обработка информации и правила сравнения показателей

68. Капитальные вложения, как способ воспроизводства основных средств

69. Основные фонды организации (предприятия) и способы улучшения их использования

70. Анализ финансово-хозяйственной деятельности: способы группировки информации и величина прибыли
71. Обработка статистической информации
72. Разработка и создание автоматизированной системы обработки информации

73. Основные этапы развития и конструктивной эволюции техники в области самолетостроения

74. Модель большого взрыва и расширяющейся Вселенной

75. Создание Вселенной или большой взрыв

76. ОСНОВНЫЕ МЕТОДЫ ГЕНЕТИКИ

77. Химия наследственности. Нуклеиновые кислоты. ДНК. РНК. Репликация ДНК и передача наследственной информации

78. Разработка основных биотехнологических процессов производства и системы управления качеством липидных косметических препаратов (на примере тоников для проблемной кожи)

79. Основные принципы создания группировок войск для сражения, принятия решения командованием и организации управления

80. Поражающие факторы ядерного оружия и способы защиты от него

Мягкий пол универсальный, желтый, 60x60 см (4 детали).
4 детали - 1,5 кв.м. Размер кромки: от 1,5 см до 3 см. Толщина деталей около 9 мм. Пол идет в комплекте с кромками.
1080 руб
Раздел: Прочие
Карандаши акварельные, с кисточкой, 24 цвета.
Шестигранный корпус покрыт лаком на водной основе. Карандаши заточенные. Длина карандаша: 176 мм. Очень мягкие, не крошатся, цвета яркие,
349 руб
Раздел: Акварельные
Велосипед трехколесный Moby Kids "Leader 360°. AIR Car", с разворотным сиденьем, цвет:.
Детский трёхколёсный велосипед премиум-класса "Leader 360° 12x10 AIR Car" от торговой марки Moby Kids. Эта модель
7324 руб
Раздел: Трехколесные

81. Способы защиты населения при радиоактивном и химическом заражении местности

82. Основные черты географии народного хозяйства Дальнего Востока

83. Основные направления научных исследований в России и за рубежом

84. Основные тенденции, перспективы развития современного мирового хозяйства

85. Объем и характеристики исходной информации для составления проектов разработки нефтяных и газовых месторождений (контрольная)

86. Геологическая история развития Австралии. Большой Водораздельный хребет
87. Основные вопросы реструктуризации государственного долга РФ
88. Основные задачи сферы государственного регулирования

89. Основні методи боротьби з інфляцією

90. Понятие опровержения и способы опровержения

91. Задачи, основные функции и система ОВД

92. Понятие, основные черты субъектов административной юрисдикции

93. Виндикационный иск как способ защиты вещных прав

94. Способы защиты гражданских прав

95. Ликвидация как способ прекращения юридического лица

96. Основные черты афинского права. Источники, право собственности, обязательственное право, брачно-семейное право, уголовное и процессуальное право

Вешалка для одежды напольная, раздвижная ТД-00012, 1450x430x1550 мм.
Длина: 145 см. Регулируемая высота: 90-155 см. Ширина: 43 см. Количество перекладин: 1. Максимальная нагрузка: 15 кг. Вешалка напольная
828 руб
Раздел: Вешалки напольные
Гель для укрепления зубов R.O.C.S. "Medical Minerals" для детей и подростков, со вкусом клубники, 45.
Благодаря определенным добавкам он формирует стабильную невидимую пленку на зубах, обеспечивает постепенное проникновение минералов в
354 руб
Раздел: Зубные пасты
Кино-хлопушка.
Реальная кино-хлопушка. Материалы: мдф, фанера. Качественная трафаретная окраска.
418 руб
Раздел: Прочее

97. Конституция - основной закон государства и общества. Конституционные акты российской государственности до октября 1917 г.

98. Основные этапы развития экономики России 9-18 веков

99. Конституционные гарантии основных прав и свобод человека и гражданина в Российской Федерации


Поиск Рефератов на сайте za4eti.ru Вы студент, и у Вас нет времени на выполнение письменных работ (рефератов, курсовых и дипломов)? Мы сможем Вам в этом помочь. Возможно, Вам подойдет что-то из ПЕРЕЧНЯ ПРЕДМЕТОВ И ДИСЦИПЛИН, ПО КОТОРЫМ ВЫПОЛНЯЮТСЯ РЕФЕРАТЫ, КУРСОВЫЕ И ДИПЛОМНЫЕ РАБОТЫ. 
Вы можете поискать нужную Вам работу в КОЛЛЕКЦИИ ГОТОВЫХ РЕФЕРАТОВ, КУРСОВЫХ И ДИПЛОМНЫХ РАБОТ, выполненных преподавателями московских ВУЗов за период более чем 10-летней работы. Эти работы Вы можете бесплатно СКАЧАТЬ.