Шрифт:
Интервал:
Закладка:
<…>
Не существует языков, где нет ничего мотивированного; но представить себе такой язык, где мотивировано было бы всё, невозможно по определению. Между двумя крайностями — наименьшей организованностью и наименьшей произвольностью — находятся все промежуточные случаи. Разные языки включают в себя элементы обоих типов — целиком произвольные и относительно мотивированные, — но в весьма разных пропорциях, и эту важную характеристику можно учитывать при классификации языков[2057].
Соссюр утверждал: «Язык есть система, все элементы которой образуют целое, а значимость одного элемента проистекает только из одновременного наличия прочих», то есть отдельно взятая языковая единица не имеет собственного значения и обретает смысл только в объединении с другими. Таким образом, семантика является производной структуры, образуемой языковыми единицами, и именно поэтому основной фокус исследований следует сделать на внутренних взаимосвязях языка, на зависимости одних его элементов от других[2058], [2059].
Одним из первых конкретных воплощений идей Соссюра стала глоссематика [glossematics] датского лингвиста Луи Ельмслева — теория, в которой язык рассматривается как одна из семиотических систем, как структура, которую можно строго формализовать, используя методы математики, логики и семиотики. Ельмслев стал одним из пионеров применения к языковым структурам алгебраических методов, и, хотя его система и не предполагала, например, возможности рекурсии, её можно рассматривать в качестве одной из первых «порождающих грамматик» (generative grammar, термин также передаётся на русский язык как «генеративная грамматика», «трансформационно-порождающая» грамматика, в ранних работах — «трансформационная грамматика»), то есть систем правил, позволяющих определить, какая комбинация слов составляет грамматически правильное предложение[2060], [2061], [2062].
Дальнейшее развитие идея трансформационных грамматик получила в работах одного из учителей Хомского — Зеллига Харриса. Именно под руководством последнего Хомский работал над своей магистерской диссертацией «Морфонология современного иврита» (Morphophonemics of Modern Hebrew), завершённой в 1951 г. Осмысливая позже результаты своих ранних исследований, Хомский писал: «Когда несколько лет спустя я начал более серьёзно исследовать генеративный синтаксис (т. е. после 1951 г. — С. М.), мне удалось приспособить для этой цели новую концепцию, разработанную Зеллигом Харрисом и несколькими его учениками, а именно — концепцию „грамматической трансформации“. Вскоре стало очевидно, что с помощью этой новой концепции могут быть преодолены многие недостатки модели, которую я использовал ранее»[2063].
Впрочем, подход Хомского с самого начала демонстрировал некоторые важные особенности, отличавшие его от подхода Харриса. Можно отметить, что для ранних работ Хомского характерен гораздо больший акцент на формальных и математических свойствах правил и их систем, чем для работ Харриса того же периода. Для Хомского преобразования [transformations] были правилами, формальными инструкциями со входами и выходами, в то время как для Харриса они были скорее констатацией регулярных соответствий между парами предложений. Хомский придерживался «вертикального» взгляда на преобразования, когда более глубокие структуры трансформировались в менее глубокие в результате последовательных преобразований, тогда как взгляд Харриса был в основном «горизонтальным». Правда, в статье «Сосуществование и трансформация» 1957 г. Харрис описывает также и «вертикальную» точку зрения, но в его работах она не получила такого глубокого развития, как в исследованиях Хомского[2064], [2065].
10 сентября 1956 г., менее чем через месяц после окончания знаменитой Дартмутской конференции, на которой Джон Маккарти впервые сделал достоянием общественности термин «искусственный интеллект», в MIT состоялся симпозиум Специальной группы по теории информации (тот самый, который, по мнению Джорджа Миллера, положил начало когнитивной науке). Два этих мероприятия были близки не только по времени проведения, но и по составу участников. Как и в Дартмуте, на симпозиуме в MIT присутствовали Аллен Ньюэлл и Герберт Саймон. Именно на симпозиуме в MIT и был представлен доклад Хомского о формальных грамматиках [formal grammars], познакомивший специалистов в области ИИ с подходом к обработке естественного языка, основанном на иерархических системах правил[2066], [2067]. Таким образом, Хомский заметно повлиял на развитие компьютерной лингвистики на заре ИИ подобно тому, как Хебб повлиял на вычислительную нейробиологию. Как и Хебб, Хомский не был первооткрывателем представленных им концепций, однако он стал тем человеком, который выстроил мост между фундаментальной наукой и прикладными исследованиями, развернувшимися в связи с развитием вычислительной техники.
В отличие от ТСТ генеративная грамматика Хомского вполне в духе структурной лингвистики абстрагируется от семантики отдельных языковых единиц (интересно, что в отношении этого тезиса Зеллиг Харрис, как мы убедимся позже, не разделял радикализма Хомского). Вклад Хомского в теоретические основы современных технологий обработки символьных данных трудно переоценить. Именно он создал классификацию формальных языков и формальных грамматик (так называемую иерархию Хомского), согласно которой все формальные грамматики (и формальные языки) делятся на четыре типа по их условной сложности (от самых сложных к самым простым: «тип 0» — неограниченные, «тип 1» — контекстно-зависимые, «тип-2» — контекстно-свободные и «тип-3» — регулярные). Иерархия Хомского устанавливает связь между свойствами вычислительных алгоритмов (и вычислительных систем), необходимых для обработки грамматики, и типами правил (продукций), лежащих в основе её организации[2068]. Однако спустя более чем полстолетия многие идеи и методы Хомского вызывают оживлённую полемику среди лингвистов. Например, Хомский считал, что человеческая психика содержит врождённый механизм усвоения языка [Language Acquisition Device], который реализует принципы генеративной грамматики и тем самым делает ребёнка способным усвоить структуру языка на базе сравнительно скудных данных[2069]. Позже американский философ Джерри Фодор, развивая идеи Хомского и стремясь уйти от идеи «специальности» когнитивных механизмов, стоящих в основе обучения языку, предложил собственную, более общую концепцию модулярности сознания[2070], а также гипотезу о «языке мышления» (Language of thought hypothesis, LTH[2071])[2072], согласно которой мысли в сознании людей представлены при помощи своеобразного языка (Фодор дал ему название «ментализ» [mentalese], дословно это название можно перевести как «психанский [язык]»), в котором определяются связи между простыми компонентами мысли или концептами. Согласно гипотезе Фодора такой язык должен быть врождённым и универсальным для всех людей.
Также стоит отметить, что наборы генеративных правил, предложенных Хомским, изначально опирались лишь на грамматику английского языка (и, возможно, отчасти иврита — единственного языка, кроме родного, с которым Хомский был сравнительно неплохо знаком). Иерархия правил на протяжении лет много раз дополнялась и пересматривалась. Словом, неудивительно, что не все специалисты в области компьютерной лингвистики были