litbaza книги онлайнСказкиИнформационные технологии и лингвистика XXI века - Алла Викторовна Гуслякова

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 16 17 18 19 20 21 22 23 24 25
Перейти на страницу:
пришедшие с интернет-магазинов (для них формируется специальный кластер).

Список кластеров выводится слева от списка результатов поиска. Для каждого кластера указывается образующая его фраза и количество документов в кластере. Пользователь может управлять кластерами при помощи специальных ссылок под списком кластеров.

Nigma поддерживает русскую морфологию. Используется морфологический модуль для русского языка собственной разработки.

Nigma позволяет производить простейшие арифметические преобразования и решать математические задачи, с учётом различных единиц измерения и распознаванием математических и физических констант. Также поддерживаются запросы на конвертацию валют, решение систем уравнений и построение графиков функций. Математическая система была запущена в октябре 2008 года.

В декабре 2008 года появилась поддержка запросов по неорганическим химическим реакциям, как по исходным, так и по конечным веществам реакции. Впоследствии были добавлены поиск химических реакций и поддержка органической химии.

На 2011 год система позволяет производить поиск по более чем 12 000 неорганических реакций. Вещества можно задавать как в виде названий («хлорид натрия», «каменная соль»), так и в виде формул («NaCl»).

Кщта эффективна для обзорного поиска при сборе информации. Она позволяет быстро найти открытые сведения из различных областей и проверить, не пропустили ли вы что-либо важное, используя другие поисковики.

Приложение 6

Правила формирования запросов в поисковых системах (на примере поисковой системы Яндекс)

Правила формирования запроса в поисковой системе Яндекс

1. Ключевые слова в запросе следует писать строчными (маленькими) буквами. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

2. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. и.

3. Для поиска устойчивого словосочетания следует заключить слова в кавычки. Например, «фонема».

4. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «сентябрь» в родительном падеже следует написать «¡сентября».

5. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &. Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

6. Для того, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, необходимо поставить перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки «+» и «-» надо писать через пробел от предыдущего и слитно со следующим словом. Например, по запросу «Волга – автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

7. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

8. Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки. Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

9. Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например, по запросу «книги – магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

10. Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&,—) задает поиск в пределах документа. Например, по запросу «дева— астрология» будут найдены документы со словом «дева», не относящиеся к астрологии.

11. Вернемся к примеру с аквариумными рыбками. После прочтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум – сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

Для поиска литературы или полнотекстовых документов возможен следующий запрос: «+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) – (цена | магазин | доставка | каталог)».

После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.

Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.

Прочитать предлагаемые статьи и приступить к устройству аквариума.

Примечания

1

Интернет (World Wide Web (WWW) «всемирная паутина») – это гетерогенная система, то есть соединение разнообразных аппаратных платформ, исполняющих приложения, предназначенные для решения широкого диапазона задач.

2

Теория «информационного общества» была развита такими известными авторами, как М. Порат, Й. Масуда, Т. Стоуньер, Р. Карц и др. (Porat М., Rubin М. The Information Economy: Development and Measurement. Wash., 1978; Masuda Y. The information Society as Post-Industial Society. Wash., 1981; Stonier T. The Wealf of Information. L., 1983; Katz R.L. The Information Society: An International Perspective. N.Y., 1988.); в той или иной мере она получила поддержку со стороны тех исследователей, которые акцентировали внимание не столько на прогрессе собственно информационных технологий, сколько на становлении технологического или технетронного (technetronic – от греч. techne) общества (Brzezinski Zb. Between Two Ages. N.Y., 1988.), или же обозначали современный социум, отталкиваясь от возросшей или возрастающей роли знаний как «the knowledgeable society», «knowledge society» или «knowledge-value society». Сегодня существуют десятки понятий, предложенных для обозначения отдельных признаков современного общества.

3

ТМХ (Translation Memory Exchange – обмен памятью переводов) – открытый формат файлов XML (англ, extensible Markup Language – расширяемый язык разметки) для обмена данными памяти переводов, которые создаются в процессе автоматизированного перевода.

4

Trados – профессиональный продукт для компаний, использующих переводческие процессы, основанный на выявлении в переводимом документе ранее переведенных фрагментов. Продукт был разработан в 1992 году немецкой компанией Trados GmbH. В 2005 году Trados был куплен британской компанией SDL International, и в 2006 году появился совместный продукт Trados SDLX. Trados SDLX имеет разные модули, необходимые для перевода документов различных форматов (Microsoft Word, PowerPoint, HTML, FrameMaker, InterLeaf и np.), а также для работы с терминологическими базами данных (модуль MultiTerm).

5

FTP (File Transfer Protocol – протокол передачи файлов) – стандартный протокол, предназначенный для

1 ... 16 17 18 19 20 21 22 23 24 25
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?