Шрифт:
Интервал:
Закладка:
2. Перечислить основные этапы информационного поиска. Дать краткую характеристику каждому этапу.
3. В чем заключаются принципиальные отличия поиска в Интернете от обычного информационного поиска?
4. Перечислить основные приложения, входящие в поисковую машину. Охарактеризовать каждое из приложений со своими примерами.
5. Какие факторы учитывает поисковая машина при отборе запрашиваемой пользователем информации?
6. Каковы наиболее популярные и эффективные поисковые системы в современном мире?
Задания для самостоятельного исследования
1. Используя три (по выбору) поисковые системы найти список самых популярных книг первой четверти нынешнего столетия. Сравнить результаты поиска.
2. Подготовить доклад по одной из поисковых систем современности.
3. Поиск по рубрикатору поисковой системы
Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию. Например:
• Бизнес и экономика;
• Общество и политика;
• Наука и образование;
• Компьютеры и связь;
• Справочники и ссылки;
• Дом и семья;
• Развлечения и отдых;
• Культура и искусство.
Рис. 1. Тематический рубрикат Рамблер. Топ 100 медийного Интеренет-портала Рамблер
Поработайте с поисковыми каталогами российских и зарубежных медийных Интернет-порталов по интересующей тематике (используя возможности поиска по ключевым словам; расширенного поиска). Выявите сходства и различия в функционировании поисковых каталогов российских и зарубежных поисковых систем.
4. Пользуясь каталогом поисковой системы, найдите следующую информацию:
• Текст песни популярной музыкальной группы;
• Репертуар Мариинского театра на текущую неделю;
• Характеристики последней модели мобильного телефона известной фирмы (по вашему выбору);
• Рецепт приготовления украинского борща с галушками;
• Долгосрочный прогноз погоды в Вашем регионе (не менее чем на 10 дней);
• Фотография любимого исполнителя современной песни;
• Примерная стоимость мультимедийного компьютера (прайс);
• Информация о вакансиях на должность преподавателя иностранных языков в Вашем регионе или городе;
• Гороскоп своего знака зодиака на текущий день;
По результатам поиска составьте письменный отчет в Word: представьте в документе найденный, скопированный и отформатированный материал.
Рекомендованная литература
1. Ашманов, И. С. Оптимизация и продвижение сайтов в поисковых системах / И.С. Ашманов, А.А. Иванов. – 3-е изд. – Москва: Питер, 2015 -463 с.
2. Байков В.Д. Интернет. Поиск информации. Продвижение сайтов /В.Д. Байков. – СПб.: БХВ-Петербург, 2000. – 288 с.
3. Колисниченко Д.Н. Поисковые системы и продвижение сайтов в Интернете /Д.Н. Колисниченко. – М.: Диалектика, 2007. – 272 с.
4. Основы информационной компетентности [Электронный ресурс]: учебное пособие: электронное издание/ М-во образования и науки Российской Федерации, Федеральное гос. бюджетное образовательное учреждение высш. проф. образования Красноярский гос. пед. ун-т им. В.П. Астафьева; сост.: Н.В. Васильева Красноярск: КГПУ им. В. П. Астафьева, 2013-1 электрон, опт. диск (CD-ROM)hh.;12 см – Загл. с этикетки диска.
5. Chu Н. Search engines for the World Wide Web: A comparative study and evaluation methodology (англ.) / H. Chu, M. Rosenthal // Proceedings of the Annual meeting – American society for information science: journal. -1996. – Vol. 33. – P. 127–135.
6. Eric W. B. Execution Performance Issues in Full-Text Information Retrieval. – University of Massachusetts Amherst: Computer Science Department, 1996. – 179 p. – (Technical Report 95–81).
7. Pariser E. The Filter Bubble: What The Internet Is Hiding From You. – NY: Penguin Group, 2011. – 257 p.
Глава 4
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫИ ЛИНГВИСТИКА
Краткое описание: искусственный интеллект, компьютерная лингвистика, история ее развития и инструментарий.
Искусственный интеллект может оказаться благоразумней его создателя.
I have noticed that even people who claim everything is predetermined and that we can do nothing to change it, look before they cross the road.
В данной главе речь пойдет о компьютерной лингвистике (computational linguistics), которая постепенно и уверенно становится основной частью технологий искусственного интеллекта.[15]
Компьютерная лингвистика – это научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Компьютерная лингвистика частично пересекается с обработкой естественных языков. Однако обработка естественных языков акцентирует внимание не на абстрактные модели, а на прикладные методы описания и обработки языка для компьютерных систем.
Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.
Основными направлениями компьютерной лингвистики являются следующие:
1. Обработка естественного языка (англ, natural language processing; синтаксический, морфологический, семантический анализы текста).
2. Корпусная лингвистика, создание и использование электронных корпусов текстов
3. Создание электронных словарей, тезаурусов, онтологий (например, Lingvo). Словари используют для автоматического и автоматизированного переводов, проверки орфографии и т. д.
4. Автоматический перевод текстов посредством специализированных программ (см. приложение 2).
5. Автоматическое извлечение фактов из текста (извлечение информации; англ .fact extraction, text mining).
6. Автореферирование (англ, automatic text summarization). Эта функция включена, например, в Microsoft Word.
7. Построение систем управления знаниями (экспертные системы).
8. Создание вопросно-ответных систем (англ, question answering systems).
9. Оптическое распознавание символов (англ. OCR). Например, программа FineReader.
10. Автоматическое распознавание и синтез речи.
Кроме того, компьютерная лингвистика занимается решением следующих научных задач:
• Компьютерный анализ жанра и характеристик автора текста (более сложный, чем анализ сюжета);
• Компьютерный анализ блогосферы как источник знаний о языке (как вариант анализа корпуса текстов).
• Создание семантической паутины Интернета (формирование пространств знаний) и поиск знаний в ней.
Перечисляя все современные возможности компьютерной лингвистики, вернемся немного в историю формирования этой научной гуманитарной отрасли.
Компьютерная лингвистика родилась в январе 1954 года, когда в Джорджтаунском университете (США) был проведен первый в мире публичный эксперимент по машинному переводу. В то же самое времена под руководством крупнейшего математика и кибернетика Алексея Ляпунова начались активные работы по машинному переводу и в Москве. В созданную Ляпуновым группу вошли, в частности, тогдашние студенты и аспиранты, будущие «родители» отечественной компьютерной лингвистики Игорь Мельчук и Ольга Кулагина.
Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational по-русски может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако в отечественной науке он приобретает более узкое значение, приближающееся к понятию «квантитативной лингвистики».
Как особое научное направление компьютерная лингвистика начала оформляться в 1960-е годы. Хотя в России основа для успехов отечественных ученых в этой области закладывалась намного раньше. В 1920-х годах в Советской России велись интенсивные исследования по семиотике текста, в то время как широкомасштабное изучение семиотики во всем мире относится только к началу 1960-х годов (что в значительной мере связано с работами эмигрировавшего из России в 1920 году создателя структурной лингвистики Романа Якобсона). Стремительный прогресс семиотики стал