Учеба фонетический разбор слова: Фонетический разбор слова и звуко-буквеннный анализ

Содержание

Фонетический разбор слова - план, примеры

Как правильно сделать фонетический разбор слова?

Фонетический разбор – это характеристика структуры слогов и состава слова из звуков.

Памятка

План фонетического разбора

  1. Записать слово орфографически правильно.
  2. Разделить слово на слоги и найти место ударения.
  3. Отметить возможности переноса слова по слогам.
  4. Фонетическая транскрипция слова.
  5. По порядку характеризовать все звуки: а. согласный – звонкий – глухой (парный или непарный), твёрдый или мягкий, какой буквой он обозначен; б. гласный: ударный или безударный.
  6. Подсчитать количество букв и звуков.
  7. Отметить случаи, если звук не соответствует букве.

Образцы фонетического разбора слов:

Я очень люблю есть морковь.

Фонетический разбор слова люблю:

  1. люблю
  2. люб – лЮ (на второй слог падает ударение, 2 слога)
  3. люб-лю
  4. [л'убл'у]
  5. Л – [л'] согласный, мягкий, звонкий и непарный;
    Ю – [у] – гласный и безударный;
    Б – [б] – согласный, твердый, звонкий и парный
    Л – [л'] – согласный, мягкий, звонкий и непарный;
    Ю – [у] – гласный и ударный
  6. В слове 5 букв и 5 звуков.

https://uchim.org/russkij-yazyk/foneticheskij-razbor-slova - uchim.org

Фонетический разбор слова морковь:

  1. морковь
  2. мор-кОвь (на второй слог падает ударение, 2 слога).
  3. Перенос: мор-ковь
  4. [маркоф']
  5. М – [м] – согласный, твердый, звонкий и непарный.
    О – [а] – гласный и безударный.
    Р – [р] – согласный, твердый, звонкий и непарный.
    К – [к] – согласный, твердый, глухой и парный.
    О – [о] – гласный и ударный.
    В – [ф'] – согласный, мягкий, глухой и парный.
    Ь —————————–
  6. В слове 7 букв и 6 звуков.
  7. о – а, в – глухой звук ф, ь смягчает в.

Видео про фонетическую транскрипцию

Полезные советы:

  • Делая фонетический разбор, нужно произнести слово вслух.
  • Важно всегда проверять транскрипцию.
  • Обязательно обращать внимание на орфограммы при фонетическом анализе.
  • Также обращать внимание на звуки, которые произносятся в слабых позициях, таких как: стечение согласных или стечение гласных, согласные шипящие, непарные согласные по твёрдости и мягкости или звонкости и глухости.

Возможно, вам также понадобится Морфологический разбор.

Всё для учебы » Русский язык » Фонетический разбор слова - план, примеры

Фонетический разбор слова - это просто

Я б в нефтяники пошел!

Пройди тест, узнай свою будущую профессию и как её получить.

Химия и биотехнологии в РТУ МИРЭА

120 лет опыта подготовки

Международный колледж искусств и коммуникаций

МКИК — современный колледж

Английский язык

Совместно с экспертами Wall Street English мы решили рассказать об английском языке так, чтобы его захотелось выучить.

15 правил безопасного поведения в интернете

Простые, но важные правила безопасного поведения в Сети.

Олимпиады для школьников

Перечень, календарь, уровни, льготы.

Первый экономический

Рассказываем о том, чем живёт и как устроен РЭУ имени Г.В. Плеханова.

Билет в Голландию

Участвуй в конкурсе и выиграй поездку в Голландию на обучение в одной из летних школ Университета Радбауд.

Цифровые герои

Они создают интернет-сервисы, социальные сети, игры и приложения, которыми ежедневно пользуются миллионы людей во всём мире.

Работа будущего

Как новые технологии, научные открытия и инновации изменят ландшафт на рынке труда в ближайшие 20-30 лет

Профессии мечты

Совместно с центром онлайн-обучения Фоксфорд мы решили узнать у школьников, кем они мечтают стать и куда планируют поступать.

Экономическое образование

О том, что собой представляет современная экономика, и какие карьерные перспективы открываются перед будущими экономистами.

Гуманитарная сфера

Разговариваем с экспертами о важности гуманитарного образования и областях его применения на практике.

Молодые инженеры

Инженерные специальности становятся всё более востребованными и перспективными.

Табель о рангах

Что такое гражданская служба, кто такие госслужащие и какое образование является хорошим стартом для будущих чиновников.

Карьера в нефтехимии

Нефтехимия — это инновации, реальное производство продукции, которая есть в каждом доме.

Фонетический (звуко-буквенный) разбор слова | ПОЛЕЗНЫЕ ПРОГРАММЫ ДЛЯ УЧЕБЫ И РАБОТЫ

Фонетический или звуко-буквенный разбор слова — это анализ слова.  Чтобы сделать фонетический разбор слова, нужно разобрать каждую букву. Для этого необходимо:

  • разделить слово по слогам, обозначить ударный слог;
  • сделать транскрипцию слова, подсчитать количество букв и звуков;
  • разобрать каждую букву и записать ее характеристику:
    • для гласного – ударный/безударный
    • для согласного –  парный/непарный, твердый/мягкий, звонкий/глухой 
  • составить цветовую схему слова (графическую форму слова).
Гласные звуки
Согласный, который стоит перед — твердый[А]  [О]  [У]  [Ы]  [Э]   
Согласный, который стоит перед — мягкий[ЙА]  
буква «Я»
[ЙО]  
буква «Ё»
[ЙУ]  
буква «Ю»
[И]  [ЙЭ]  
буква «Е»
 
Согласные звуки 
звонкие парные[Б][В][Г][Д][Ж][З]
глухие парные[П][Ф][К][Т][Ш][С]
звонкие непарные[Й’][Л][М][Н][Р] 
глухие непарные[Х][Ц][Ч’][Щ’]  
Согласные, которые всегда…
всегда мягкие     [Ч’]      [Щ’]      [Й’]
всегда твердые     [Ж]      [Ш]       [Ц]
всегда звонкие     [Й’]      [Л]      [М]      [Н]      [Р]
всегда глухие     [Х]       [Ц]      [Ч’]      [Щ’]
без звука      Ь — чтобы смягчить,     Ъ — чтобы разъединить

Комментарий

Транскрипция слова — звуки, которые записываются в квадратные скобки. Могут использоваться дополнительные знаки, например, обозначение мягкости. 

Звонкие согласные   образуются с участием звука, а глухие — с помощью шума.
Парные согласные образуют пару глухой/звонкий. Например, [Б]/[П], [В]/[Ф], [Г]/[К].

Непарные согласные не образуют пары: [Л], [М], [Р].

Пример: фонетический (звуко-буквенный) разбор слова «ягода»

Слоги: я́-го-да (3 слога, ударение падает на 1-й слог)
Переносы слова: яго-да
Фонетическая транскрипция слова: [й’агада]
я́-го-да [й’агада] — 5 букв, 6 звуков
я  [ й’] согласный, звонкий непарный, мягкий
     [ а ] гласный, ударный
г [ г ] согласный, звонкий парный, твёрдый, шумный
о [ а ] гласный, безударный
д [ д ] согласный, звонкий парный, твёрдый, шумный
а [ а ] гласный, безударный

Цветовая схемайагада

 

На сайте можно скачать программу «Русский алфавит — карточки для печати«, с помощью которой можно распечатать все буквы алфавита с их характеристиками для звуко-буквенного разбора слова.

Все статьи по русскому языку можно прочитать по метке «Русский язык«

P.S. Это мы сделали себе шпаргалку по фонетическому (звуко-буквенному) разбору слова — не потеряется и всегда под рукой :))

Навигация по записям

Советы учителя - Звуко-буквенный (фонетический) разбор слова, учитель начальных классов в Москве

Фонетика — раздел науки о языке, изучающий звуковые средства. Фонетические знания и умения необходимы для формирования всех четырех видов речевой деятельности человека: слушания (аудирования) говорения, чтения и письма. 

Для того чтобы адекватно воспринимать слышимую речь, нужно иметь развитый фонематический слух, благодаря которому мы различаем слова по их звучанию, фонетические способности помогают нам по интонации улавливать смысл, который говорящий вкладывает в высказывание. Поскольку русское письмо звуко-буквенное, читающий оперирует в процессе чтения звуками. Отсюда требование: исходным пунктом в обучении чтению должна стать ориентировка в звуковой действительности языка. В настоящее время обучение грамоте по любому букварю начинается с до буквенного периода, когда учащиеся на практике осваивают фонетику.

Фонетические знания и умения важны для всего последующего обучения чтению и письму. Например, такое качество чтения, как выразительность, нельзя сформировать, не познакомив учащихся с интонацией, логическим ударением. Фонетические умения — необходимая база для становления осознанных навыков правописания, без них нельзя сформировать орфографическую зоркость учащихся.

На фонетику мы опираемся и при обучении лексики, грамматике, морфемике.

Выполняя фонетический разбор в школе, ученик должен уметь выделять гласные и согласные звуки, соотносить их с буквами.

  1. Буквы – это графические знаки, с помощью которых на письме обозначаются звуки. Полного соответствия между звуками и буквами нет.
  2. Гласные звуки
    В русском алфавите всего 33 буквы.
    Две из них — Ь и Ъ не относятся ни к гласным, ни к согласным буквам, звуков не обозначают.
    Гласные буквы: бывают ударными или безударными, образуют слоги. Сколько в слове гласных звуков, столько и слогов.
    Гласных букв 10: а, о, у, э, ы, я, ё, ю, е, и.
    Гласных звуков 6: [а], [о], [у], [э], [и], [ы].
    А, О, У, Э, Ы – обозначают твёрдость согласных звуков.
    Я, Ё, Ю, Е, И – обозначают мягкость согласных звуков.
  3. Йотированные гласные буквы (буквы, обозначающие два звука). Обозначают два звука, если стоят:
    Я - [jа] Ю- [jу] Е – [jэ] Ё – [jо]
    * в начале слова (ель, яблоко, юла)
    * после Ъ и Ь (съем, семья, подъём, вьюн)
    * после гласных букв (клюёт, воют, военный)
    Буквы е, я, ю, ё обозначают один звук [э], [а], [у], [о] после согласного только под ударением: век - [в'эк], мяч- [м'ач'], блюз - [бл'ус], мед - [м'от]
    В безударном положении эти буквы после согласного обозначают звук [иэ]
    ряды [р’ и д ы] лесок [л’ и с о к]
  4. Согласные звуки
    Согласных букв 21: н, м, л, р, й, б, в, г, д, ж з, п, ф, к, т, ш, с, х, ц, ч, щ.
    Согласных звуков в русском языке – 36.
  5. Согласные звуки образуют 6 пар звонких и глухих согласных:
  6. [б] - [п], [в] - [ф],[г] - [к], [д] - [т], [ж] - [ш], [з] - [с].
  7. Кроме того, согласные звуки образуют 15 пар твёрдых и мягких согласных:
  8. [б] -[б'], [в] - [в'], [г] - [г'], [д] -[д'], [з] - [з'], [к] - [к'],[л] - [л'],[м] - [м'],
  9. [н] - [н'],[п] - [п'], [р] - [р'], [с] - [c'], [т] - [т'],[ф] - [ф'], [х] - [х'].
  10. Сонорные звуки: [л], [м], [н], [р], [й].
  11. Пять непарных глухих звуков: [х], [х’] [ц], [ч’], [щ’].
    Всегда твёрдые согласные звуки: [ж], [ш], [ц].
    Всегда мягкие согласные звуки: [ч’], [щ’], [й’].

План фонетического разбора

1. Запишем слово.

2. Поставим ударение.

3. Запишем справа транскрипцию слова, разделим его на слоги.

4. Охарактеризуем все звуки, записывая их сверху вниз:

4.1. ударный-безударный для гласных;

4.2. звонкий-глухой (пара), твёрдый-мягкий (пара) для согласных;

5. Подсчитаем количество звуков и букв

Образец:

морковь мор-кóвь 2 слога

м – [м] - согл., сонорн. непарн., тв. парн.

о – [а] - гласн., безуд.

р – [р] - согл., сонорн. непарн., тв. парн.

к – [к] - согл., глух. парн., тв. парн.

о – [о] - гласн., ударн.

в – [ф'] - согл., глух. парн., мягк. парн.

ь – [ ]

___________________________

7 букв, 6 звуков

Орфограмма — это место в слове:

  1. где пишется не так, как слышится;
  2. где звук слышится неясно;
  3. где возможна ошибка;
  4. где при письме возникает трудность;
  5. где требуется применение правила;
  6. где для обозначения определенного звука нужно выбрать букву.

фонетический разбор слов польют линейка ширина опера учёба мольба

Решите пожалуйста!!!!!!!!!

продолжение номера 21:с человеком сойдёт..ся. добро век не забудет..ся. за худым пойдеш.., худое и найдёш.. . как аукнет..ся, так и откликнет..ся. не … плюй в колодец, случит..ся водицы напит..ся. Нес..частья боят..ся-с..частья не видать.​

Назовите художественные средства, использованные в данных высказываниях: Благодаря сытному обеду сделался сытым студент, огонь и пламя, стальные нервы … , лунный серп, флейта водосточных труб, хлеб всему голова, земля и небо, Варвара с длинною косой новенькой косой траву косила, в песочных часах песок с песчаного пляжа, отпереть замок в замок с принцессой, война и мир, читал Есенина, костер рябины красной, соседский мальчик из соседнего дома ни с кем не здоровается, весь город встал на защиту памятника, горячий снег, семь пятниц на неделе, ждать у моря погоды, эта печь так и просит в ней испечь, позорная слава, его перо любовью дышит. ​

ПОМОГИТЕ МНЕ ПРОШУ УМОЛЯЮ ВАС

Мы сидели в тени но и в тени было душно найти в тексте слова где 1 слог и 2 согласных, 2 слога и 2 согласных, 1 слог и соглласных

Вопрос: Выпиши из предпоследнего абзаца словосочетания, соответствующие схеме: существительное + прилагательное. Отметь в каждом словосочетании главно … е слово. Предпоследний абзац: Неглубокий залив окружён раскаленной пустыней и поэтому напоминает большой котел, в котором сильно нагревается морская вода . А оттого что вода от жары испаряется на дне залива откладывается особенная соль.

Ребята срочно два листа 10 баллов!!!!Плиииз!

Почему прохожий не понял мальчика? Как правильно нужно было задать вопрос? Напиши. А я спросил у прохожего: Ваня спросил у прохожего. Скажите сколько … часов? Каких часов ? Удивился прохожий.

что токое приставка ?​

Списать. Подчеркнуть грамматические основы, написать характеристику предложений. Над яркими цветами жужжат трудолюбивые пчёлы. На склонах оврагов появ … ились ранние весенние цветы. Лунная дорожка тускло сверкала по глади моря. Выписать слова с удвоенными согласными и подобрать родственные слова(не менее 2-х).

Статья "Фонетический разбор слова на уроках русского языка в начальных классах"

Вопрос о звуковом анализе – один из сложнейших в начальных классах. Впервые вопрос о предварительных звуковых упражнениях в русской методике (методике обучения чтению) был поставлен Ушинским К. Д..

Основоположник звукового метода в России считал необходимым развивать речевой слух у детей, умение слышать отдельные звуки и их последовательность в словах.

Фонетический разбор - основной вид упражнений, который развивает фонетические способности учащихся.

По мнению Д.Б. Эльконина, фонемный (звуковой) анализ в своей исходной форме есть установление последовательности фонем (звуков) в полном слове [ Эльконин Д.Б. -1976. – С.48] .

В методике различают собственно фонетический (звуковой) и фонетикографический (звукобуквенный).

Цель собственно звукового разбора – это характеристика звуковой структуры слова без обращения к буквам. Собственно звуковой разбор учащиеся выполняют в подготовительный период обучения грамоте. При переходе к изучению букв, как показывает практика преподавания, звуковой разбор полностью исключается из употребления.

Мы думаем, что звуковой разбор может использоваться на всём протяжении обучению языку в младших классах и даже применяться как особый вид фонетических упражнений в последующем обучении.

Во-первых, этот вид фонетического анализа убеждает, что со звуками можно работать и без букв, а это очень важно, чтобы освободить школьника от переоценки роли буквы.

Во-вторых, способы осознанного звукового анализа, сформированные без опоры на буквы, воспитывают у ученика отношение к материи языка как некой реальности, с которой можно производить свои особые действия и которая предполагает специфические средства контроля за выполнением этих действий.

Рассмотрим и проанализируем программы и учебники по русскому языку разных образовательных систем.

Анализ программы Т.Г.Рамзаевой (образовательная система “Классическая начальная школа”) показывает, что выдвигаются такие требования к умениям учащихся: производить анализ делением слов на слоги, определять ударный слог, последовательность звуков и букв в словах типа конь, сова, стриж (2 класс).

В 4 классе программа предлагает проводить звукобуквенный анализ систематически в целях формирования навыков безошибочного написания слов и развития орфографических умений. Для анализа взяты слова типа лодка, школьный, площадь.

В учебнике Рамзаевой Т.Г. для 3 класса предлагается порядок звукобуквенного разбора слов на форзаце:

1. Напиши слово, поставь знак ударения.

2. Определи, сколько слогов в слове.

3. Сколько гласных букв и сколько согласных?

4. Какой звук обозначает согласные буквы: звонкий или глухой, мягкий или твердый.

Образец записи:

Льдинка – 2 слога, 6 звуков, 7 букв; 2 гласных, 4 согласных, [л ] - звонкий, мягкий; [д ]– звонкий, мягкий; [н ] - звонкий, твердый; [к ]– глухой, твердый.

Как видим, под фонетическим разбором понимается звукобуквенный анализ.

Составители учебника Русский язык 2. класс Бунеев Р.Н., Бунеева Е.В., Пронина О.В. предлагают такой порядок звукобуквенного анализа слова:

1. Прочитай слово, поставь ударение.

2. Раздели слово на слоги.

3. Прочитай ударный слог.

4. Прочитай безударные слоги.

5. Назови звуки, какими буквами они обозначены.

6. Дай характеристику звуков.

7. Сосчитай, сколько в слове звуков, сколько букв.

В данной системе обучения “Школа 2100” по программе Бунеевых Р.Н. и Е.В. в период обучения грамоте дети учатся произносить звуки, слушать звучащее слово, соотносить произношение и написание, делать звукобуквенный анализ доступных слов.

Основные требования к умениям второклассников: производить звукобуквенный анализ слов и соотносить количество звуков и букв в доступных словах.

Таким образом, в данной программе под фонетическим разбором понимается звукобуквенный [Программно-методические материалы. 2000. С.37, 44, 215, 227, 231, 236].

В учебниках Поляковой A.B. по русскому языку (система развивающего обучения Л.В.Занкова) порядок разбора не предлагается, хотя раздел “Фонетика” представлен с 1 по 4 классы.

В программе по развивающей системе Л.В. Занкова в основных требованиях к знаниям, умениям, навыкам за 1 класс написано, что учащиеся должны уметь:

• производить фонетический разбор: вычленять звуки в словах, определять последовательность звуков и букв в слове, соотносить количество звуков и букв в словах, делить слова на слоги, определять количество слогов и ударный слог;

• различать твердые и мягкие согласные;

• обозначать на письме мягкость согласных звуков буквами и, е, ё, ю, я и мягким знаком и различать эти способы обозначения мягкости согласных: с одной стороны, буквами, которые обозначают звуки, с другой - мягким знаком, который никакого звука не обозначает;

• различать звонкие и глухие согласные звуки [Сборник программ для четырехлетней начальной школы. Система Л.В. Занкова.; 2005. С.49].

В соответствии с действующей сейчас вариативной программой по русскому языку в системе Л.В.Занкова фонетические знания также являются ведущими в букварный период. Это вполне справедливо, так как они лежат в основе обучения детей важнейшим общеучебным умениям - чтению и письму.

В первый месяц обучения по букварю [Андрианова Т.М., Андрианова И.Л., 2003] на фоне знаний о речи, предложений, слове проводятся наблюдения позиционной смены звуков. Ученики, сопоставляя слова, слышат разницу в произношении гласных и согласных, составляют двуцветные схемы (гласные - красный цвет, согласные - бесцветные).

Затем также при сопоставлении слов (мал – мял, Маша - Миша) устанавливается разница в произношении твердых - мягких согласных. Делается вывод о том, что для правильного чтения согласного необходимо посмотреть, какой гласный следует за ним, составляются трехцветные схемы: (мягкий согласный - зеленый цвет, твёрдый согласный - синий цвет, гласный - красный цвет).

Далее проводится сопоставление слов, раскрывающих явление глухости - звонкости: папа - баба.

Итак, на первом этапе обучения чтению по развивающей программе Занкова звуковой анализ превалирует над самой процедурой чтения.

В данный период ученики проводят звуковой разбор слов, наблюдают над звуками на коротких, простых по составу словах.

В системе развивающего обучения Л.В. Занкова работа над звуковым анализом ведется в основном в букварный период, а затем она проводится над звуком и буквой параллельно. Во 2, 3, 4 классах работа над собственно звуковым анализом не планируется, а в основном идет звукобуквенный разбор слов.

Как показывает школьная практика, собственно звуковому разбору на уроках уделяется недостаточно времени. Поэтому нами была разработана программа, направленная на формирование умений собственно звукового разбора слов и состоящая из блоков: 1 блок – “Звуки”, 2 блок – “Слоги”, 3 блок – “Ударение”.

Работа имела системный характер: начиналась в букварный период в первом классе и была продолжена во втором классе. Применение дидактических игр как одного из наиболее продуктивных средств обучения позволило, во-первых, учить детей без принуждения. Во-вторых, игра помогала, наряду с формированием и развитием фонематического восприятия, организовать учебную деятельность ребенка, обогащала его новыми сведениями по фонетике, активизировала мыслительную деятельность, внимание, развивала речь. В-третьих, игра применялась в различных вариантах (иногда использовался только фрагмент игры), при этом обновлялся учебный материал, включался в нее материал разноуровневого характера.

В первом блоке работа велась над гласными и согласными звуками.

Первоначальная работа (1 этап) проводилась с опорой на вспомогательные средства: графическую схему слова и фишки ( - гласный звук, - мягкий согласный звук, - твердый согласный звук).

По мере выделения звуков ребенок заполняет схему фишками. Действие, которое осуществлял ученик, представляло собой практическое действие по моделированию последовательности звуков в слове.

На 2 этапе формировались действия звукового разбора в речевом плане. Называлось слово, определялся первый, второй, третий звуки, уточнялось их количество, давалась характеристика звукам.

Второй блок – деление слова на слоги – не вызывал у учащихся трудностей, если слоги были открытыми. Формировались умения деления слов на слоги с неслоговым [й']. Проводились наблюдения правил слогораздела (до-брый, у-до-бный).

В третьем блоке у учащихся формировалось представление о словесном ударении и его роли в русском языке. Дети учились находить и выделять в словах ударный слог.

Цели программы: развитие фонематического слуха ребенка, формирование умения сознательно выполнять собственно звуковой разбор слова, развитие памяти, внимания, наблюдательности.

С целью отслеживания эффективности данной программы проводился эксперимент. В эксперименте участвовали два класса (1 “А”, 1 “Б” (контрольный класс), [2”А”, 2”Б”]).

В 1 “А”, [2 “А”] классе с первого года обучения велась систематическая работа над звуковым разбором по разработанной нами программе. В 1 “Б”, [2 “Б”] обучение велось только в рамках учебной программы.

Первая диагностика была проведена в марте 2007 года в 1 “А” и 1 “Б” классах. Учащимся предлагалось провести звуковой разбор слов по вариантам.

1 вариант: пила, карась, стул, малина.

2 вариант: грибы, шарик, лиса, природа.

Слова состояли из одного, двух, трех слогов.

Задание: разделить данные слова на слоги, определить ударный слог, записать звуковую “рубашку” слова.

Были получены следующие результаты (см. таблицу 1):

Таблица 1

Анализ элементов звукового разбора слова в 1 “А” и 1 “Б” классах

Класс

Гласные

Ударные гласные

Безударные гласные

Твердые согласные

Мягкие согласные

Слоги

ударение

1 “А”

100%

91,3%

65,2%

91,3%

78,2%

82,6%

91,3%

1 “Б”

72,2%

66,6%

72,2%

83,3%

44,4%

83,3%

52,2%

Выводы: Наибольшие трудности учащиеся 1”А” класса испытывали при определении безударных гласных в слове (65,2%), ошибки были допущены в определении мягких согласных в слове (78,2%).

Учащиеся 1 “Б” класса допустили наибольшее количество ошибок при определении мягких согласных (44,4%), также много ошибок было в постановке ударения (52,2%).

Учащиеся 1 “А” класса лучше справились с заданиями при определении гласных звуков в слове, постановке ударения в словах, в нахождении мягких согласных.

Учащиеся 1 “Б” класса показали лучше результаты в нахождении безударных гласных, в делении слов на слоги.

Таким образом, в 1 “А” классе 73,9% учащихся выполнили задания без ошибок. 26% учащихся выполнили задания с ошибками.

В 1 “Б” классе только 27,7% учащихся выполнили задания без ошибок. 72,2% учащихся допустили ошибки при выполнении данной работы.

Проведенный нами констатирующий срез в двух первых классах показал, что осознанные умения звукового разбора слов у учащихся не сформированы.

В результате проведенного исследования перед нами возникла необходимость в выявлении эффективных методических приемов и разработке системы упражнений с целью ликвидации допущенных детьми ошибок.

Проанализировав методическую литературу и обобщив опыт, мы разработали систему упражнений по проблеме исследования, в которых за основу взяли приемы и упражнения, предлагаемые в учебниках и методических пособиях развивающих систем Д.Б. Эльконина, Л.В. Занкова, по которой занимаются дети, а также упражнения из методического пособия Максимук Н.Н., журналов “Начальная школа”, собственные методические находки с целью формирования фонетических умений.

Во 2 “А” классе (экспериментальном) мы продолжили целенаправленную работу над формированием фонетических умений.

Работу организовали более глубоко и разнообразно, задания постепенно усложнялись, проводились дидактические игры.

В конце октября 2007 года была проведена повторная диагностика во 2 “А” и 2 “Б” классах. Учащимся предлагалось провести звуковой разбор слов по вариантам.

1 вариант: Рая, пеньки, пушистый.

2 вариант: Яша, письмо, душистый.

Слова состояли из двух, трех слогов.

Задание: послушай слово, запиши звуковую “рубашку” слова, раздели слово на слоги, определи ударный слог, подчеркни мягкие согласные двумя чертами, твердые согласные одной чертой.

Были получены следующие результаты: (см. таблицу 2)

Таблица 2.

Анализ элементов звукового разбора слова во 2 “А” и 2 “Б” классах

Класс

Гласные

Ударные гласные

Безударные гласные

Твердые согласные

Мягкие согласные

Слоги

ударение

2 “А”

95,4%

95,4%

86,3%

81,8%

86,3%

100%

95,4%

2 “Б”

56,2%

56,2%

56,2%

12,5%

12,5%

68,7%

62,5%

Выводы: во 2 “А” классе (экспериментальном) дети испытывали трудности в определении твердых и мягких согласных.

Во 2 “Б” классе (контрольном) также низкие показатели в определении твердых и мягких согласных.

Во 2 “Б” классе (контрольном) также низкие показатели в определении твердых и мягких согласных.

справились, не справились

Рис.3. Качество выполнения звукового разбора слов во 2 “А” и 2 “Б” классах

Во 2 “А” классе 81,8% учащихся выполнили задания без ошибок, а 18,2% учащихся допустили ошибки.

Во 2 “Б” классе (контрольном) только 12,5% учащихся выполнили задания без ошибок, 87,5% учащихся выполнили задания с ошибками.

Качество выполнения звукового разбора слов во вторых классах показало, что ученики 2 “А” класса (экспериментального) на 69,3% лучше справились с данной работой.

Из всего вышесказанного сделали вывод, что с помощью использованных нами методических приемов и упражнений, мы смогли ликвидировать ранее допущенные ошибки у большинства учащихся, дети показали хорошие результаты при проведении звукового разбора слов.

Основное условие для занятий по звуковому разбору – систематичность, она необходима на протяжении всего периода школьного обучения. Звуковая культура речи является составной частью речевой культуры, требует особого подхода, специальных приёмов.

Как научить ребенка читать? Советы родителям дошкольника

Типичные ошибки родителей в обучении ребенка чтению

Упор на запоминание букв, а не звуков

Казалось бы, что плохого в том, чтобы запомнить букву «В» как [вэ], а букву «М» как [эм] или [мэ]? Но когда вместо «метро», ребенок скажет «мэетэрэо», ошибка станет очевидна. Необходимо учить ребенка называть буквы только соответствующими им звуками: «В» — [в], «М» — [м] и т.д.

Изнуряющие занятия

Дети 3-4 лет не могут долго быть внимательными, поэтому им будет достаточно 10-минутного занятия. С ребятами 5-6 лет оптимально заниматься по 15-20 минут. Если видите, что ребенок стал рассеянным, занятие стоит прекратить.

Психологическое давление

«Тебе уже 5 лет, а ты все еще не умеешь читать! Как же тебя в школу возьмут?» Запугивания лишь отобьют у ребенка желание заниматься. Или вовсе вызовут страх перед чтением.

Английский писатель Эйдан Чамберс в своей книге «Расскажи. Читаем, думаем, обсуждаем» писал, что маленького читателя важно хвалить за каждое достижение. Вот он подошел посмотреть на книжки, взял одну из них, а потом вдруг решил переключиться на другую. И каждый из этих шагов важен.

Отсутствие у родителей привычки читать

Дети во всем стараются подражать взрослым. И если они видят, что мама или папа садятся за книгу, им непременно захочется ее почитать. Поэтому важно, чтобы в семье существовала культура чтения.

Как развить живой интерес ребенка к чтению и учебе вообще?

Читайте книги вместе с ребенком

Обсуждайте и пересказывайте их содержание, чтобы ребенок понимал и запоминал текст. Можно зачитывать вслух интересные отрывки из книг и предлагать ребенку узнать, о чем речь пойдет дальше, дочитав книгу самостоятельно.

Покажите детям, что чтение — это ключ к двери, за которой кроется множество волшебных миров. Увлеченный книгами ребенок будет с интересом учиться и узнавать новое каждый день. Будьте для ребенка наставником, который всегда поддержит и даст совет.

Предложите развивающие задания в форме игры

Что такое фонетический разбор - Языкознание 2021

Наверное, нельзя назвать язык, в котором буквы алфавита полностью соответствуют звукам, где слова читались бы именно так, как они написаны. Фонетический анализ слов помогает выявлять закономерности в словообразовании определенного языка, помогает правильно строить разговорный язык и повышает письменную грамотность.

Что такое фонетика

Фонетика как отрасль науки о языке изучает звуковой состав речи: звуки, звуковые сочетания, слоги, ударение в слове.Слово «фон» по-гречески звучит. Объектом изучения фонетики являются не все звуки, издаваемые или воспроизводимые человеком, а только те, которые используются для речевого общения в словаре определенного языка.

Звуки и буквы

Во-первых, нужно четко понимать, что звуки и буквы - это не одно и то же. Звук - это наименьшая единица речи; это то, что люди слышат и говорят. А буквы - это знаки, которые согласились обозначать звуки. Письменная речь возникла на определенном этапе развития культуры того или иного народа косвенного общения.Алфавитное письмо изначально подразумевало изображение и передачу с помощью определенного значка звука речи. Из-за того, что в человеческом языке много активных звуков, такое соответствие звуков и букв сделало бы алфавит слишком громоздким. Поэтому определенные правила чтения писем стали появляться в различных ситуациях. Во многих мировых языках количество звуков и букв в словах может не совпадать, иногда значительно. Особенно это характерно для французского языка.

Русский алфавит

В русском языке в сильной позиции (ударение) 6 гласных: A, O, Y, S, I, E и 36 согласных. Кроме того, согласные в русском языке образуют 11 пар звонкий / глухой и 15 пар твердость / мягкость. Что касается букв, то в настоящее время в русском алфавите 31 буква и 2 символа: b и b.

Акустико-фонетические представления в распознавании слов

Познание. Авторская рукопись; доступно в PMC 2012 5 декабря.

Опубликован в окончательной отредактированной форме как:

PMCID: PMC3514860

NIHMSID: NIHMS418740

Университет Индианы

Запросы на переиздание следует направлять Дэвиду Б. Писони, Департамент психологии, Университет Индианы, 47405, Блумингтон, Индиана. USA

Окончательная отредактированная версия этой статьи издателем доступна на Cognition. См. Другие статьи в PMC, в которых цитируется опубликованная статья.

Abstract

В этой статье рассматривается то, что в настоящее время известно о сенсорном и перцептивном вводе, который предоставляется системе распознавания слов процессами, которые обычно считаются связанными с восприятием звука речи.В первом разделе мы обсуждаем несколько основных проблем, с которыми исследователи речи пытались справиться на протяжении последних тридцати лет. Во втором разделе мы рассматриваем одну попытку концептуализировать процесс восприятия речи в рамках теоретической основы, которая приравнивает этапы обработки к уровням лингвистического анализа. Эта структура предполагает, что речь обрабатывается через ряд аналитических этапов, начиная от периферической слуховой обработки, акустико-фонетического и фонологического анализа до распознавания слов и лексического доступа.

Наконец, в последнем разделе мы рассмотрим несколько недавних подходов к распознаванию устных слов и лексическому доступу. Мы исследуем ряд утверждений, касающихся природы восходящего ввода, предполагаемого этими моделями, постулируемых единиц восприятия и взаимодействия различных источников знаний в слуховом распознавании слов. Дополнительная цель этой статьи заключалась в том, чтобы установить необходимость использования сегментарных представлений в распознавании устных слов.

1. Введение

Хотя проблемы распознавания слов и природа лексических представлений давно интересовали когнитивных психологов, эти темы не изучались широко исследователями, работающими в основном направлении исследований восприятия речи.В течение многих лет эти два направления исследований оставались совершенно разными. Такое положение вещей объясняется несколькими причинами. Во-первых, основная часть исследований по распознаванию слов была посвящена изучению визуального распознавания слов при чтении, почти не уделяя внимания проблемам распознавания устных слов. Во-вторых, большая часть интереса и исследовательских усилий в области восприятия речи была связана с проблемами, связанными с восприятием функций и фонем в строго контролируемой среде с использованием бессмысленных слогов.Такой подход подходит для изучения «низкоуровневого» слухового и акустико-фонетического анализа речи, но он не так полезен при решении вопросов, касающихся того, как слова распознаются изолированно или в контексте или как различные источники информации используются слушатель, чтобы восстановить намеченное сообщение говорящего.

Теперь ясно, что многие интересные и потенциально весьма важные проблемы в области восприятия речи связаны с интерфейсом между акустико-фонетическими процессами и процессами распознавания слов и лексического доступа.Эти проблемы связаны с природой акустических сигналов, которые слушатели извлекают из речевого сигнала, процессами, используемыми для интеграции этих сигналов, и различными типами единиц восприятия, которые вычисляются системой обработки речи (Liberman, Cooper, Shankweiler & Studdert -Кеннеди, 1967; Стивенс и Хаус, 1972; Студдерт-Кеннеди, 1974). Например, значительный интерес представляет точное определение видов представлений, которые существуют в ментальном лексиконе, и промежуточных представлений, которые вычисляются слушателем при преобразовании речевого сигнала в символическое представление.Являются ли слова, морфемы, фонемы или последовательности спектральных шаблонов правильным способом характеристики репрезентаций лексических статей в понимании разговорного языка? Доступно ли слово в лексиконе на основе акустического, фонетического или фонологического кода? Почему часто встречающиеся слова распознаются так быстро? И как контекст используется для поддержки распознавания слов и облегчения доступа к значению слова? Это несколько вопросов, на которые необходимо ответить, прежде чем станет возможным полное понимание распознавания устных слов.

В этой статье мы рассматриваем природу сенсорных и перцептивных входных данных, которые предоставляются системе распознавания слов процессами, которые обычно считаются связанными с восприятием звука речи. В первом разделе мы суммируем несколько фундаментальных проблем, которые исследователи речи пытались решить за последние тридцать пять лет. Мы сосредотачиваем наше обсуждение на давних проблемах инвариантности, линейности и сегментации речевого сигнала, чтобы проиллюстрировать сложные отношения, существующие между речевой формой волны и единицами лингвистического описания.Мы также рассматриваем проблемы, связанные с идентификацией основных единиц перцептивного анализа и типов представлений, которые вычисляются системой восприятия речи. Во втором разделе мы рассматриваем одну попытку концептуализировать процесс восприятия речи в рамках теоретической основы, которая приравнивает уровни лингвистического анализа к этапам обработки. Наконец, в последнем разделе мы рассмотрим несколько недавних подходов к распознаванию устных слов и лексическому доступу. Здесь мы исследуем утверждения, касающиеся природы восходящего ввода, предполагаемого этими моделями, единиц восприятия и потенциального взаимодействия различных источников информации при распознавании слов.

2. Фундаментальные проблемы восприятия речи

Фундаментальные проблемы восприятия речи сегодня - это те же проблемы, которые ускользали от окончательного решения более тридцати пяти лет (Fant, 1973; Joos, 1948). Несмотря на то, что неразрешимость этих давних проблем привела к появлению огромного количества литературы по воспроизведению и восприятию речи, исследователям все еще трудно объяснить, как именно слушатель-человек преобразует непрерывно изменяющуюся форму речевого сигнала в дискретные языковые единицы и как эти единицы используются для извлечения языкового сообщения, предназначенного говорящим.В самом деле, мы не только до сих пор не уверены в точной природе языковых единиц, полученных при перцепционной обработке речи, но и мало внимания уделялось проблеме того, как сенсорный и перцепционный анализ речевой волны соприкасается с представлениями слов. в лексиконе или как эти представления используются для поддержки понимания языка.

Многие, если не все, проблемы с восприятием речи связаны с тем, как она воспроизводится. Фонемы редко, если вообще когда-либо, реализуются в форме волны речи как линейно упорядоченная последовательность дискретных акустических событий.Это связано, прежде всего, с тем, что говорящие объединяют соседние фонемы, так что на артикуляцию одной фонемы влияет артикуляция соседних фонем. Было чрезвычайно сложно идентифицировать акустические особенности в форме речевого сигнала, которые однозначно соответствуют воспринимаемым фонемам, независимо от окружающего контекста (см. Stevens & Blumstein, 1981). Акустические последствия коартикуляции и других источников контекстуально обусловленной изменчивости приводят к тому, что акустический сигнал не удовлетворяет двум важным формальным условиям, инвариантности и линейности, что, в свою очередь, порождает проблему сегментации.

2.1. Линейность речевого сигнала

Условие линейности гласит, что для каждой фонемы в высказывании должен быть соответствующий отрезок звука (Chomsky & Miller, 1963). Более того, если за фонемой X следует фонема Y в фонематическом представлении, звуковой отрезок, соответствующий фонеме X, должен предшествовать звуковому отрезку, соответствующему фонеме Y в физическом сигнале. Очевидно, что в акустическом сигнале не выполняется условие линейности. Из-за коартикуляции и других контекстных эффектов акустические характеристики соседних фонем часто «размазываются» по фонемам в речевой форме волны.Хотя сегментация возможна согласно строго акустическим критериям (см. Fant, 1962), количество акустических сегментов обычно больше, чем количество фонем в высказывании. Более того, не было обнаружено простого инвариантного отображения между этими чисто акустическими атрибутами или особенностями и воспринимаемыми фонемами. Это размытие или параллельная передача акустических характеристик приводит к участкам речевой волны, в которых присутствуют акустические особенности более чем одной фонемы (Liberman et al., 1967). Следовательно, не только редко встречается конкретный отрезок звука, который однозначно соответствует данной фонеме, но также редко бывает, чтобы акустические характеристики одной фонемы всегда предшествовали или следовали акустическим характеристикам соседних фонем в физическом сигнале. По этой причине Liberman et al. (1967) утверждали, что речь - это не простой шифр или алфавит, а, напротив, сложный код, в котором «звуки речи представляют собой очень значительную реструктуризацию фонематического« сообщения »» (стр.4). Поэтому одна из центральных проблем в области восприятия речи сосредоточена на преобразовании непрерывно меняющегося речевого сигнала в последовательность дискретных языковых единиц, таких как фонемы, телефоны или аллофоны.

2.2. Акустико-фонетическая инвариантность

Еще одно условие, которому речевой сигнал не удовлетворяет, - это принцип инвариантности (Chomsky & Miller, 1963). Это условие гласит, что для каждой фонемы X должен быть определенный набор критериальных акустических атрибутов или характеристик, связанных с ней во всех контекстах.Эти особенности должны присутствовать всякий раз, когда встречается X или какой-либо вариант X, и они должны отсутствовать всякий раз, когда в представлении встречается какая-либо другая фонема. Из-за эффектов коартикуляции акустические характеристики данного речевого звука часто меняются в зависимости от фонетической среды, в которой он воспроизводится. Например, переходы формант для согласных, начинающихся со слога, которые указывают место артикуляции (например, / b / vs. / d / vs. / g /), значительно различаются в зависимости от следующей гласной (Liberman, Delattre, Cooper, И Герстман, 1954).Формантные переходы для стоп-согласных в позициях начала слога не определяют однозначно место артикуляции для всех гласных. Если формантные переходы являются основными сигналами к месту артикуляции для стоп-согласных, они должны быть сильно зависимыми от контекста и не инвариантными в разных фонетических контекстах. Короче говоря, проблема инвариантности заключается в объяснении перцептивного постоянства звуков речи, несмотря на отсутствие надежных акустических коррелятов в форме речевого сигнала (Stevens & Blumstein, 1981; Studdert-Kennedy, 1974).

2.3. Сегментация на единицы более высокого порядка

Контекстно-обусловленная изменчивость соответствия между речевым сигналом и фонемой также представляет огромные проблемы для сегментации формы речевого сигнала на единицы более высокого порядка лингвистического анализа, такие как слоги и слова. Из-за несоблюдения условий линейности и инвариантности, отмеченных выше, речевой сигнал не может быть сегментирован на акустически определенные единицы, которые независимы от соседних сегментов или свободны от обусловливающих эффектов контекстов уровня предложения.Например, с помощью простых физических критериев было трудно определить, где заканчивается одно слово и начинается другое, особенно в связной речи. Однако сегментация слов может быть возможна с учетом систематической внутренней структуры слов, и мы вернемся к этому вопросу ниже.

2.4. Единицы перцептивного анализа

Помимо проблем линейности, инвариантности и сегментации, есть еще одна неприятная проблема, которая возникает из-за слипания речи.Эта проблема включает отношения между единицами перцептивного анализа и единицами, принятыми из лингвистического анализа. Было высказано предположение, что ограничения пропускной способности каналов в слуховой системе требуют, чтобы необработанная сенсорная информация была перекодирована в некое абстрактное представление, которое можно использовать для последующего анализа (Liberman et al., 1967). Однако то, что составляет эти абстрактные единицы анализа, было темой давних дискуссий в области исследования речи. Многие исследователи утверждали, что фонетическая особенность, фонема и слово являются первостепенными при перцепционной обработке речи.Другие исследователи даже предлагали такие большие единицы, как предложение или предложение (Bever, Lackner, & Kirk, 1969; Miller, 1962). На наш взгляд, большая часть дебатов по поводу выбора базовой единицы восприятия в языковой обработке несколько ошибочна, поскольку по мере изменения уровня лингвистической обработки меняются и единицы перцептивного анализа. На наш взгляд, вопрос о том, является ли одним основным или первичным блоком , в значительной степени неправильный, поскольку на самом деле существует множество единиц, используемых механизмом обработки речи.Во всяком случае, проблема для теоретика восприятия представляет собой взаимодействие между различными единицами, а не идентификация или определение одной базовой единицы перцептивного анализа. Для некоторых целей достаточно абстрактных единиц, таких как фонемы, чтобы зафиксировать важные различия и обобщения внутри и между областями ограничений (Allen, 1985). Для других целей могут быть более подходящими более параметрические представления формы волны речи.

Однако остается важный вопрос относительно того, какие единицы являются обязательными, или необходимыми при перцепционной обработке речи и какова природа этих единиц.Хотя ни одна единица не может быть первичной, все же необходимо указать, какие единицы вообще используются при восприятии речи, распознавании слов и лексическом доступе. Эта проблема возникла прежде всего при попытках уточнить исходное акустико-фонетическое представление речи. Из-за сильно закодированной природы фонем в речевой форме волны, возникающей в результате коартикуляции (Fischer-Jorgensen, 1954; Liberman et al., 1967), ряд исследователей отказались от представления о том, что сегментное представление фактически воспринимается слушателем во время речи. обработка.Альтернативные источники, чтобы назвать несколько, предлагали слоги (Cole & Scott, 1974a, b; Massaro & Oden, 1980; Studdert-Kennedy, 1974, 1980), контекстно-зависимые аллофоны (Wickelgrcn, 1969, 1976) и контекстно-зависимые. чувствительные спектры (Klatt, 1980) как минимальные единицы кодирования речевого сигнала. Эти подходы обычно пытались обойти проблему определения того, как фонематическое сегментальное представление конструируется из речевой волны, в которой не выполняются условия линейности и инвариантности (см., Однако, Studdert-Kennedy, 1974).Хотя один или несколько из этих подходов к проблеме единицы анализа могут быть правильными в той или иной форме, мы полагаем, что все еще существуют значительные доказательства, которые могут быть собраны в поддержку утверждения о том, что на начальных этапах обработки речи некоторый тип сегментарного представление является производным (см. ниже). Однако остается вопрос, что такое исходная единица кодирования речи и как она вычисляется системой обработки. Для целей настоящего обсуждения достаточно просто отметить здесь, что этот вопрос не был решен удовлетворительно даже среди исследователей в этой области.Тем не менее, исследования продолжаются, несмотря на неоднозначность и разногласия по поводу основных единиц обработки в восприятии речи. По нашему мнению, такие единицы, как фонемы, которые определены в лингвистической теории, вероятно, не являются хорошими кандидатами на роль единиц обработки при анализе речи в реальном времени. Однако такие устройства, как телефоны, аллофоны или контекстно-зависимые дифоны, могут быть более подходящими для получения важных обобщений о речи и служить в качестве единиц восприятия на самых ранних стадиях восприятия речи.

3. Перцепционная обработка речи

Восприятие речи обычно рассматривается как процесс, охватывающий различные стадии анализа при преобразовании речевого сигнала в намеченное сообщение (Studdert-Kennedy, 1974, 1976). Этот компонентный анализ восприятия речи оказался очень полезным для создания концептуальной основы, с которой можно приступить к изучению понимания устной речи. Хотя точная природа каждой из постулируемых стадий и взаимодействия между стадиями все еще являются предварительными, они, тем не менее, теоретически оправданы с лингвистической точки зрения.Студдерт-Кеннеди (1974) был первым, кто отстаивал этот подход. Он предложил четыре концептуальных этапа анализа: (1) слуховой, (2) фонетический, (3) фонологический и (4) лексический, синтаксический и семантический. При обсуждении этапов перцептивной обработки речи мы добавили пятый этап обработки - периферический слуховой анализ - чтобы выделить несколько недавних подходов к восприятию речи, которые сосредоточены на самых ранних преобразованиях речевого сигнала периферической слуховой системой. Концептуально этот этап обработки фактически представляет собой подкомпонент этапа слухового анализа, предложенного Студдерт-Кеннеди.

3.1. Периферический слуховой анализ

За последние три или четыре года в литературе было опубликовано множество новых исследований о том, как периферическая слуховая система кодирует речевые сигналы (см. Carlson & Granstrom, 1982). Исследования периферийной обработки речевых сигналов идут по двум разным направлениям. Во-первых, был проведен ряд важных физиологических исследований с использованием животных для довольно точного описания того, как речевые сигналы кодируются в периферической слуховой системе (Delgutte, 1980, 1982).В этих исследованиях изучалась активность слухового нерва в ответ на простые речевые сигналы, такие как устойчивые гласные и стоп-согласные в слогах согласных и гласных. Целью этой работы было выявление надежных и заметных свойств в паттернах разряда волокон слухового нерва, которые некоторым прямым образом соответствуют важным акустическим свойствам или атрибутам звуков речи (Sachs & Young, 1979).

Следуя второму подходу к периферийной обработке речи, несколько исследователей начали разрабатывать психофизические модели обработки речи (Klatt, 1982).Эти модели явно включают хорошо известные психоакустические данные в свои описания фильтрации, осуществляемой периферической слуховой системой (Searle, Jacobson, & Rayment, 1979; Zwicker, Terhardt, & Paulus, 1979). Целью этого направления исследований является разработка представлений речевого сигнала, которые учитывают известные психофизические факты о слухе, такие как критические полосы, распространение маскировки вверх и рост громкости (Klatt, 1982).

Searle et al.(1979) рассмотрели вопросы, связанные с подходящей полосой пропускания фильтров, используемых слушателями-людьми для обработки речевых стимулов. Анализируя данные психофизических и физиологических исследований, Searle et al. предполагают, что периферическая слуховая система человека анализирует слуховые стимулы примерно с -Октавное разрешение по частоте. Выбор Ширина полосы ⅓-октавы мотивирована не только психофизическими и физиологическими данными, но и свойствами человеческой речи. Поскольку полоса пропускания пропорциональна частоте, Полоса пропускания-октавы обеспечивает спектральное разрешение на низких частотах, а также временное разрешение на высоких частотах.Спектральное разрешение низких частот позволяет разделить первую и вторую форманты, в то время как временное разрешение высоких частот обеспечивает точную временную информацию для быстрого появления всплесков. Исходя из известных фильтрующих свойств периферической слуховой системы человека, Searle et al. смогли сконструировать распознаватель фонем с довольно высокими уровнями точности для различения начальных стоп-согласных в слогах согласный-гласный, тем самым продемонстрировав степень, в которой распознавание речи может быть улучшено после того, как психологически разумные преобразования речевого сигнала включены в периферийные представления речи .

Недавний интерес и обширные исследовательские усилия по разработке новых и предположительно более подходящих и достоверных представлений речевых сигналов частично объясняются предположением, что более подробное изучение этих слуховых представлений должно, в принципе, предоставить исследователям много полезного. более актуальная информация об отличительных аспектах восприятия, лежащих в основе звуков речи (Stevens, 1980). Далее предполагалось, что информация, содержащаяся в этих так называемых нейроакустических и психоакустических репрезентациях, внесет важный вклад в окончательное решение проблемы акустико-фонетической инвариантности речи (Goldhor, 1983).Хотя новые и важные результаты, несомненно, будут получены в результате продолжающихся исследований того, как речевые сигналы обрабатываются на слуховой периферии, не следует вводить в заблуждение, полагая, что эти новые исследовательские усилия по обработке речи слуховым нервом предоставят все необходимые решения. в области обработки речи. Напротив, все еще необходимо гораздо больше исследований по вопросам, касающимся центральных слуховых механизмов, используемых при распознавании образов, и источников информации более высокого уровня при восприятии речи (Klatt, 1982).

3.2. Центральный слуховой анализ

После первоначального преобразования речевого сигнала периферической слуховой системой, акустическая информация о спектральной структуре, основной частоте, изменениях функции источника, общей интенсивности и продолжительности сигнала, а также о начале и смещении амплитуды собирается извлекается и кодируется слуховой системой (Stevens, 1980). Предполагается, что эти спектральные и временные паттерны речевого сигнала сохраняются в сенсорной памяти в течение короткого периода времени, в течение которого проводится анализ акустических характеристик (см. Pisoni & Sawusch, 1975).Результаты слухового анализа дают «речевые подсказки»; то есть слуховые представления речевого сигнала, которые впоследствии используются для фонетической классификации.

Большое количество исследований за последние тридцать пять лет было посвящено описанию акустических сигналов для фонетических сегментов. (Обзоры можно найти в Darwin, 1976; Pisoni, 1978; Studdert-Kennedy, 1974, 1980.) Как правило, многие акустические сигналы отображаются на одном фонетическом элементе. Например, Лискер (1978) перечислил шестнадцать возможных сигналов для озвучивания интервокальных стоп-согласных.В целом, однако, можно перечислить несколько основных сигналов, которые служат для обозначения места, манеры и звучания согласных, а также переднего-заднего хода и высоты гласных. Например, для стоп-согласных (/ b /, / d /, / g /, / p /, / t /, / k /) место артикуляции может обозначаться направлением и степенью формантных переходов, грубо спектральная форма всплеска выброса в начале, частота спектрального максимума во всплеске и ширина полосы всплеска (см. Cole & Scott, 1974a, b; Delattre, Liberman, & Cooper, 1955; Dorman, Studdert- Kennedy, & Raphael, 1977; Liberman, Delattre, & Cooper, 1952; Liberman, Delattre, Cooper, & Gerstman, 1954; Stevens & Blumstein, 1978).

Озвучивание начальной остановки может сигнализироваться временем начала голоса, частотой первого формантного перехода и амплитудой всплеска (см. Abramson & Lisker, 1965; Lisker & Abramson, 1964; Stevens & Klatt, 1974; Summerfield & Haggard , 1974). Среди множества сигналов, сигнализирующих о послевокалических остановках, являются продолжительность закрытия (в пост-ударном слог-медиальном положении), длительность предшествующего гласного, степень формантных переходов и озвучивание в завершение (Denes, 1955; Fitch, 1981; House , 1961; Лискер, 1957, 1978; Порт, 1977, 1979; Рафаэль, 1972; Рафаэль и Дорман, 1980).Таким образом, для любого заданного фонетического контраста ясно, что несколько акустических событий участвуют в передаче сигналов контраста, и именно на стадии слухового анализа такие сигналы извлекаются.

3.3. Акустико-фонетический анализ

Предполагается, что акустико-фонетический уровень, первый уровень, на котором выполняется лингвистическая обработка, является следующим этапом перцептивного анализа. Здесь речевые реплики из предыдущего уровня анализа отображаются на отличительные фонетические признаки.Фонетические особенности можно рассматривать как абстрактные коды восприятия и памяти, которые обозначают комбинации как конкретных акустических атрибутов, с одной стороны, так и их артикуляционных предшественников, с другой стороны. В фонетической и фонологической литературе было удобно описывать эти особенности в терминах артикуляционных описаний и ярлыков, прежде всего потому, что эти обозначения фиксируют лингвистически релевантные различия на фонетическом и фонологическом уровнях. Одно описание речи на этом уровне состоит из фонетической матрицы, в которой столбцы представляют дискретные фонетические сегменты, а строки указывают состав фонетических признаков каждого сегмента (Chomsky & Halle, 1968).

Акустико-фонетический уровень анализа привлек большое внимание в связи с гипотезой о том, что на этом этапе обработки речи могут работать специализированные детекторы фонетических признаков (Abbs & Sussman, 1971; Eimas & Corbit, 1973; см. Diehl , 1981, для обзора). Идея детекторов признаков в восприятии речи была первоначально предложена Эймасом и Корбитом (1973) на основе двух источников доказательств. Первая линия доказательств была получена в результате исследования восприятия речи младенцев, которое продемонстрировало, что 1- и 4-месячные младенцы различают определенные речевые и неречевые стимулы почти так же, как и взрослые (Eimas, Siqueland, Jusczyk, & Vigorito, 1971).Младенцы различали речевые контрасты категориальным образом, так что межкатегорийные стимулы (например, / bae / и / dae /) различались лучше, чем внутрикатегорийные стимулы (например, два разных токена / bae /). Однако различение у младенцев сопоставимых неречевых стимулов не было явным преимуществом для стимулов между категориями, чем для стимулов внутри категорий (Eimas, 1974). Из-за поразительного сходства действий младенцев и взрослых как в отношении речевых, так и неречевых стимулов, Эймас (1974) предположил, что младенцы при рождении оснащаются детекторами признаков, специализированными для обработки речевых стимулов.(См. Aslin, Pisoni, & Jusczyk, 1983, для дальнейшего обсуждения этих и связанных с ними вопросов восприятия речи младенцев.) который был проведен Эймасом и Корбитом (1973). Обзоры см. В Cooper (1975) и Eimas and Miller (1978). Эймас и Корбит (1973) интерпретировали свою демонстрацию избирательной адаптации речи как свидетельство работы специализированных детекторов фонетических признаков.Они пришли к выводу, что повторное предъявление конечного стимула утомляет детекторы, настроенные на фонетические особенности стимула. Усталость детектора, чувствительного к функции озвучивания, вызывает сдвиг функции идентификации в сторону озвученной или глухой части континуума, в зависимости от используемого адаптера. Эймас и Корбит пришли к выводу, что результаты исследования младенцев, а также демонстрация избирательной адаптации к речи подтверждают идею специализированных детекторов признаков на уровне фонетического анализа.

The Eimas et al. (1971) и исследования Эймаса и Корбита (1973) вдохновили большое количество исследований как по восприятию младенцев, так и по избирательной адаптации, обзор которых выходит далеко за рамки настоящего обсуждения (см. Ссылки, приведенные выше, для обзоров). Здесь достаточно отметить, что понятие специализированных детекторов фонетических признаков было оставлено. Исследования восприятия младенцев и избирательной адаптации с тех пор показали, что ранее продемонстрированные эффекты лежат не на уровне фонетического анализа, а, скорее, на более ранней стадии или стадиях анализа слуховых характеристик (Eimas & Miller, 1978; Ganong, 1978; Sawusch, 1977а, б; см. Также Ремез, 1979).В элегантном исследовании Sawusch and Jusczyk (1981) четко идентифицирован локус эффектов избирательной адаптации на слуховом уровне. Савуш и Ючик обнаружили, что адаптация следует спектральным характеристикам адаптера, а не воспринимаемой фонетической идентичности, таким образом, четко поместив эффекты избирательной адаптации на уровень слухового анализа.

3.4. Фонологический анализ

На уровне фонологического анализа фонетические признаки и сегменты предыдущего уровня преобразуются в фонологические сегменты.Фонологический компонент предоставляет информацию о звуковой структуре данного языка, которая накладывается на фонетическую матрицу для получения фонологической матрицы (Chomsky & Halle, 1968). Таким образом, фонологические правила, которые применяются к фонетическому входу на этом уровне, определяют степень, в которой фонетические сегменты функционируют как отличительные элементы в языке, и степень, в которой эти атрибуты могут быть предсказаны либо из правил, специфичных для языка, либо из универсальных принципов языка. .Таким образом, на этом уровне можно систематически учитывать предсказуемые и повторяющиеся фонетические детали. Аллофонические вариации, присутствующие на фонетическом уровне, также удаляются, и только фонологически отличительная информация кодируется для последующей обработки.

Исторически лингвисты полагали, что выходной сигнал фонологического компонента представляет собой линейно упорядоченную последовательность фонем, в которой слоги не играют никакой роли в фонологической организации (Chomsky & Halle, 1968). Однако недавно некоторые фонологи (Clements & Keyser, 1983; Halle & Vergnaud, 1980; Kahn, 1976; Selkirk, 1980) постулировали иерархическое представление внутренней структуры слога, в котором основными составляющими являются начало - необязательный начальный согласный или кластер согласных - и rime - остальная часть слога, исключая словоизменительные окончания.Некоторые предварительные поведенческие данные (Treiman, 1983) показывают, что такие составляющие могут быть психологически реальными. Тогда может быть, что на этой стадии анализа вычисляются как фонематический, так и слоговой уровни организации (см. Аналогичное предложение в Halle, 1985).

Здесь следует упомянуть два аспекта фонологического уровня в этой схеме обработки. Первый касается уже упомянутого выше предположения о том, что сегментное представление вычисляется слушателями при обработке речи в режиме онлайн.Как мы упоминали ранее, несколько исследователей отказались от понятия четкого фонематического уровня репрезентации в восприятии речи, в первую очередь из-за трудностей, возникающих при идентификации линейно упорядоченных, инвариантных акустических сегментов в форме волны, которые соответствуют фонемам (например, Klatt, 1979 , 1980; Массаро и Оден, 1980; Виклегрен, 1969, 1976). Если невозможно собрать достаточные доказательства фонетического уровня репрезентации, было бы излишним постулировать фонологический уровень анализа в любой концептуальной структуре восприятия речи.Однако мы считаем, что можно привести ряд убедительных аргументов, чтобы продемонстрировать необходимость абстрактного сегментарного представления на некотором уровне процесса восприятия речи (см. Также Studdert-Kennedy, 1976, 1980). Поскольку предположение о сегментарных представлениях сыграло такую ​​важную роль в лингвистике и особенно в восприятии речи и распознавании слов за последние тридцать пять лет, ниже мы представляем краткую защиту существования сегментных представлений в обработке речи.

3.5. Анализ речи высшего порядка

Помимо уровня фонологического анализа, для перекодированного речевого сигнала выполняется несколько дополнительных уровней анализа «высшего порядка». Во-первых, мы предполагаем, что распознавание слов и лексический доступ принимают в качестве входных данных некоторое сегментное представление речевого сигнала. Это представление может состоять из телефонов, аллофонов или контекстно-зависимых фонемоподобных единиц. При распознавании слов образцы из более низких уровней анализа затем сопоставляются с представлениями слов, находящихся в долговременной памяти.Лексический доступ происходит, когда значения слов соприкасаются в долговременной семантической памяти (см. Другие статьи в этом выпуске).

Во-вторых, функциональные, семантические и синтаксические роли слова также выводятся из некоторого сегментарного представления речевого сигнала для анализа и интерпретации высказывания. Просодическая информация также интерпретируется для организации высказывания в кратковременной памяти, для определения синтаксических границ, для прогнозирования предстоящих моделей стресса и для оценки определенных прагматических аспектов разговорной ситуации.Короче говоря, необходим большой анализ после фонологического уровня, чтобы восстановить намеченное сообщение говорящего.

Точная роль этих более высоких уровней анализа в управлении более ранними уровнями обработки данных является предметом значительного интереса среди исследователей. Некоторые из вопросов, которые в настоящее время изучаются, касаются степени, в которой более высокие уровни обработки взаимодействуют с первоначальным акустико-фонетическим и фонологическим анализами, роли источников информации более высокого уровня в прогнозировании предстоящего речевого ввода и степени, в которой другие источники информации может компенсировать неправильное восприятие и плохую акустико-фонетическую информацию в сигнале.Хотя ранее считалось, что многие из этих вопросов выходят за рамки непосредственного интереса исследователей восприятия речи, все большее число теоретиков осознают необходимость уточнения вкладов более высоких уровней анализа, чтобы более полно понять процесс восприятия речи. Возможно, более важно то, что существует реальная необходимость установить точку соприкосновения в понимании языка между ранним сенсорным акустико-фонетическим вводом и самой системой языковой обработки.Первичный локус этого интерфейса, по-видимому, лежит на уровне обработки, соответствующем распознаванию слов и лексическому доступу (см. Marslen-Wilson & Tyler, 1980; Marslen-Wilson & Welsh, 1978).

4. Сегментарные репрезентации в восприятии речи

В течение ряда лет продолжались дискуссии о роли сегментарных репрезентаций в восприятии речи и распознавании устных слов. Некоторые теоретики полностью отказались от промежуточного сегментарного уровня представления в пользу моделей прямого доступа.В этих моделях слова распознаются без промежуточного анализа их «внутренней структуры» на такие единицы, как аллофоны, фонемы, дифоны или полусложные слова. Сторонники этой точки зрения утверждали, что их модели распознавания не требуют постулирования или использования этих промежуточных представлений и что слушатели-люди фактически не используют эти единицы при анализе разговорной речи в реальном времени. В этом разделе мы выступаем против этой позиции и суммируем данные из нескольких различных областей, подтверждающие существование этих процессоров в восприятии речи и распознавании устных слов.Хотя некоторые теоретики пытались игнорировать или даже отрицать существование этих единиц, мы предполагаем, что они фактически являются , неявно предполагаемыми всеми современными моделями распознавания слов. Без этого предположения было бы невозможно восстановить внутреннюю структуру слов и получить доступ к их значениям. Основываясь на нескольких источниках доказательств, мы утверждаем, что выходной сигнал системы восприятия речи состоит из некоторой формы сегментарного представления. Более того, именно это представление формирует входные данные для процессов, участвующих в распознавании слов и лексическом доступе.

Первая общая линия доказательств, которые мы предлагаем в поддержку сегментарных представлений в восприятии речи, исходит из лингвистики. Одно из фундаментальных предположений лингвистического анализа состоит в том, что непрерывно меняющаяся форма речевого сигнала может быть представлена ​​как последовательность дискретных единиц, таких как функции, телефоны, аллофоны, фонемы и морфемы. Это предположение является центральным для наших нынешних представлений о языке как о системе правил, которые управляют звуковыми паттернами и последовательностями, используемыми для кодирования значений (Chomsky & Halle, 1968).Само существование фонологических явлений, таких как чередование, систематическая регулярность, диахронические и синхронные звуковые изменения, требует ipso facto постулирования некоего сегментарного уровня для улавливания значимых лингвистических обобщений. Таким образом, при описании звуковой структуры данного языка требуется уровень сегментарного представления, чтобы учесть идиосинкразические и предсказуемые закономерности в звуковом паттерне этого языка (см. Kenstowicz & Kisseberth, 1979).Однако другой вопрос, действительно ли эти сегментные единицы используются слушателями-людьми при анализе разговорной речи в реальном времени.

Вторая общая линия доказательств в поддержку сегментарных представлений в восприятии речи носит более психологический характер. Психологические доказательства гипотезы о сегментарном уровне репрезентации в восприятии речи поступают из ряда различных источников. Одним из источников доказательств являются наблюдения за носителями языков без орфографии, которые пытаются разработать системы письма.В своей известной статье «Психологическая реальность фонем» Сепир (1963) приводит несколько примеров случаев, когда выбор орфографии неграмотным говорящим выявил сознательное понимание фонологической структуры его языка. Совсем недавно Рид (1971) описал ряд примеров детей, которые спонтанно изобрели собственную орфографию. Первоначальные встречи детей с печатью демонстрируют систематическое понимание сегментной структуры языка, тем самым демонстрируя способность анализировать устную речь в представлениях дискретных сегментов, таких как телефоны, аллофоны или фонемы.Действительно, недавно было высказано предположение (Liberman, Shankweiler, Fischer, & Carter, 1974; Rozin & Gleitman, 1977; Treiman, 1980), что способность маленьких детей научиться читать алфавитную систему письма, такую ​​как английская орфография, в значительной степени зависит от их развития. навыков фонематического анализа, то есть навыков, которые позволяют ребенку сознательно анализировать речь на сегментарные единицы.

Существование языковых игр, основанных на вставке звуковой последовательности в определенные точки в слове, перемещении звука или звуковой последовательности из одной точки в другую в слове или удалении звука или звуковой последовательности - все это обеспечивает дополнительные поддержка существования сегментарных представлений внутренней структуры слов (см. Treiman, 1983, 1985).Существование рифм и метрической структуры поэзии также влечет за собой осознание, так или иначе, того, что слова имеют внутреннюю структуру и организацию, и что эта структура может быть представлена ​​как линейная последовательность дискретных единиц, распределенных во времени.

Исследование ошибок в речевом воспроизведении дает дополнительное свидетельство того, что слова представлены в лексиконе в виде некоторого сегментарного представления. Высокая частота односегментных речевых ошибок, таких как замены и обмены, свидетельствует о фонологической структуре языка (Fromkin, 1973, 1980; Garrett, 1976, 1980; Shattuck-Hufnagel & Klatt, 1979; Stemberger, 1982).Было трудно, если не невозможно, объяснить такого рода ошибки, не предполагая некоторого сегментарного представления в организации лексики, используемой для производства речи.

За прошедшие годы было получено множество перцептивных открытий, которые можно интерпретировать как поддержку анализа речи на сегментарные представления. Возможно, наиболее убедительные данные были получены в результате многочисленных экспериментов, включающих анализ ошибок и недоразумений в краткосрочной памяти, а также ошибок, возникающих при прослушивании слов и бессмысленных слогов, представленных в шуме (Conrad, 1964; Klatt, 1968; Miller & Nicely, 1955; Ван и Билгер, 1973; Викельгрен, 1965, 1966).Хотя некоторые из этих результатов первоначально интерпретировались как поддержка различных типов систем функций, они также предоставляют убедительные доказательства того, что слушатель выполняет анализ внутренней структуры входного стимула в измерениях, используемых для кодирования и хранения в памяти. Хотя эти результаты можно интерпретировать как поддержку сегментарного анализа речевого ввода, они также были предметом альтернативных интерпретаций из-за конкретных задач. Как мы отмечали ранее, размер единицы восприятия изменяется по мере изменения уровня анализа в соответствии с экспериментальной задачей и инструкциями испытуемым.Если бы данные о восприятии и кратковременной памяти были единственными находками, которые можно было бы процитировать в поддержку сегментарных представлений, можно было бы менее склонно принимать сегментарный уровень представления в восприятии речи и распознавании устных слов. Однако есть и другие сходные источники доказательств из исследований восприятия, которые обеспечивают дополнительную поддержку этой точки зрения.

Например, было множество отчетов, описывающих эффект восстановления фонемы (Samuel, 1981a, b; Warren, 1970), феномен, демонстрирующий онлайн-синтез сегментных свойств беглой речи слушателем.Также были проведены многочисленные исследования с использованием задачи мониторинга фонем, в которой от субъектов требуется обнаруживать присутствие определенной целевой фонемы при прослушивании предложений или коротких высказываний (см. Foss, Harwood, & Blank, 1980). Хотя некоторые более ранние результаты (Foss & Swinney, 1973; Morton & Long, 1976) предполагали, что слушатели сначала распознают слово, а затем проводят анализ сегментов в этом слове, другие более свежие результаты (Foss & Blank, 1980) показывают, что Субъекты могут обнаруживать фонемы в несловах, которых нет в лексиконе (см. также Foss & Gernsbacher, 1983).Таким образом, испытуемые могут обнаруживать фонемы на основе двух источников знаний: информации, полученной от сенсорных входов, и информации, полученной на основе их знания фонологической структуры языка (Dell & Newman, 1980).

Также был собран большой объем данных об обнаружении неправильного произношения при беглой речи (см., Например, Cole, 1973; Cole & Jakimik, 1978, 1980). Хотя эти результаты были интерпретированы как поддержка первенства распознавания слов в восприятии речи (Cole, 1973), эти результаты можно так же легко использовать для поддержки утверждения о том, что слушатели могут получить доступ к внутренней структуре слов с точки зрения их восприятия. сегментные представления, и что они могут делать это, слушая непрерывную речь.

Наконец, с точки зрения данных о восприятии, существует небольшой массив данных о неправильном восприятии беглой речи (Bond & Games, 1980; Bond & Robey, 1983). Ошибки, собранные в этих исследованиях, предполагают, что очень большая часть неправильных представлений связана с сегментами, а не целыми словами.

Рассмотрев несколько источников доказательств для постулирования фонологического уровня анализа, мы теперь кратко рассмотрим, какие типы анализа выполняются на этом уровне. Мы утверждали, что на уровне фонологического анализа сегментарное представление выводится на основе акустико-фонетических характеристик, вычисленных на предыдущем уровне анализа.То есть фонетический сегмент преобразуется в абстрактное систематическое сегментарное представление (Chomsky & Halle, 1968). Процесс преобразования информации на фонетическом уровне в систематические сегментные представления сложен в том смысле, что эти представления являются абстрактными объектами, которые могут быть реализованы любым количеством способов на фонетическом уровне. Например, в беглой речи слово «и» может производиться как [ænd], [æen] или [ən] (Oshika, Zue, Weeks, Neu, & Aurbach, 1975).

На фонологическом уровне анализа слушатель применяет свои знания фонологических правил языка при отображении фонетических репрезентаций на более абстрактные сегментарные репрезентации.Большая часть изменчивости на фонетическом уровне по своей сути регулируется правилами, так что слушатель может значительно упростить задачу получения абстрактных представлений из акустико-фонетической формы волны, используя свои знания фонологии и морфологии. Oshika et al. (1975) предложили общий класс фонологических правил, которые пытаются описать эту систематическую вариацию произношения, чтобы проиллюстрировать роль, которую знание фонологических правил может играть в обработке речи. Среди правил, предложенных Oshika et al.это (1) уменьшение гласных, (2) взмахи альвеол, (3) палатализация, (4) гоморганическая стоп-делеция и (5) редукция гемината. Каждое из этих правил описывает общие явления, встречающиеся в непрерывной речи. Например, правило уменьшения гласных описывает тенденцию безударных гласных реализовываться как [ə]. Таким образом, хотя «и» часто может быть реализовано как [ən] на фонетическом уровне анализа, слушатель может «восстановить» лежащее в основе представление, используя свои знания фонологического правила, регулирующего редукцию гласных.Точно так же знание слушателем обстоятельств, при которых мешающие альвеолики палатализируются, может позволить ему восстановить репрезентацию «сделал ли ты» из его фонетической реализации как [dyu]. Таким образом, большая часть задачи перевода акустико-фонетической информации в некоторый тип сегментарного представления упрощается благодаря знанию нескольких общих правил, которые объясняют большую часть изменчивости на фонетическом уровне (см. Church, 1987, этот выпуск).

5. Распознавание разговорных слов и лексический доступ

Среди наиболее важных тенденций в области восприятия речи в последнее время был повышенный интерес к теориям слухового распознавания слов и лексического доступа.Хотя основная работа по фундаментальным проблемам акустической фонетики все еще ведется, многие исследователи начали расширять область своих исследований, включив в нее процессы распознавания произнесенных слов и извлечения значений из долговременной памяти. На наш взгляд, восприятие речи не является синонимом восприятия фонемы, хотя большая часть ранних работ подчеркивала эту ориентацию. Ни у кого не может быть сомнений в том, что восприятие речи - чрезвычайно сложный процесс, включающий множество уровней обработки, от фонетического восприятия до семантической интерпретации.Выделение одного уровня обработки для исследования при игнорировании возможного вклада и взаимодействия с другими уровнями, на наш взгляд, в некоторой степени близоруко и может привести к совершенно неверным теориям. То, что мы узнаем, например, о распознавании слов, может повлиять на наши теории фонетического восприятия, и наоборот. Конечно, анализ процесса восприятия речи значительно упрощается за счет разделения нашей области исследования на отдельные подкомпоненты. Однако, исследуя один подкомпонент (например,g., фонетическое восприятие) в ущерб другим (например, распознавание слов), по-видимому, ограничивает наше понимание процесса в целом, а также приводит нас к постулированию теорий на одном уровне, которые явно несостоятельны или несостоятельны с учетом того, что мы знать об обработке на других уровнях анализа.

Значительная часть работы, проделанной за последние тридцать пять лет в области восприятия речи, была связана с «первичной проблемой распознавания»; то есть, как форма речевого высказывания распознается или идентифицируется на основе анализа акустической формы волны (Fry, 1956).Сознательная идентификация и понимание всех сегментов в слове, вероятно, не являются необходимыми или даже обязательными для распознавания слова, хотя это, безусловно, возможно при особых обстоятельствах, когда внимание слушателя направлено именно на звуковую структуру высказывания. В нормальных условиях прослушивания слушателю-человеку может не потребоваться идентифицировать весь фонетический ввод, чтобы распознать слова в высказывании. Контекст и другие ограничения могут служить для сужения доступных вариантов, так что для успешного распознавания слов необходимо идентифицировать только небольшую часть акустической волны.

Хотя теории распознавания слов и лексического доступа, которые мы обсуждаем ниже, слишком расплывчаты, чтобы дать какое-либо существенное представление о природе звукового восприятия речи в настоящее время, они указывают на растущую тенденцию рассматривать восприятие речи в более широких рамках обработка разговорной речи. Кроме того, эти теории представляют то, что можно было бы назвать «новым» интересом среди некоторых исследователей речи, а именно способ использования акустико-фонетической информации для связи с лексическими элементами долговременной памяти.В этом заключительном разделе мы кратко рассмотрим пять современных подходов к распознаванию слов и лексическому доступу. Каждый из этих аккаунтов был предложен для решения несколько различных эмпирических проблем в распознавании слов и лексическом доступе, но каждый обращается к актуальной теме, представляющей определенный интерес в распознавании слов, а именно, в какой степени источники знаний более высокого уровня влияют на восприятие. произнесенных слов. Другой вопрос, решаемый, по крайней мере частично, каждой из этих теорий, - это способы, с помощью которых лексические элементы активируются в памяти.Здесь мы заинтересованы в определении характера восходящего ввода и единиц обработки, предполагаемых каждой теорией. В частности, нас интересует степень, в которой эти модели предполагают существование сегментных представлений, явным или неявным образом, для решения основной проблемы распознавания.

На протяжении следующего обсуждения мы проводим различие между распознаванием слов и лексическим доступом. Говоря о распознавании слова , мы явно ссылаемся на те процессы, которые отвечают за создание шаблона из акустико-фонетической информации в форме речевого сигнала и сопоставление этого шаблона с шаблонами, ранее сохраненными в памяти (т.е., для слов) или шаблонов, сгенерированных правилом (т. е. для псевдослов). Распознавание слов, на наш взгляд, синонимично термину : восприятие формы , как обсуждали Брэдли и Форстер (1987, этот выпуск), и фонетическому восприятию , как обсуждали Либерман и др. (1967) и Студдерт-Кеннеди (1974, 1980). Говоря о лексическом доступе , мы явно ссылаемся на те процессы, которые отвечают за обращение к соответствующей лексической информации в памяти после совпадения с образцом.Таким образом, лексический доступ - это процесс извлечения информации о словах, хранящихся в ментальном лексиконе. Более подробное обсуждение некоторых из этих моделей можно найти в других статьях этого выпуска.

Из проведенного нами различия между процессами распознавания слов и лексическим доступом должно быть ясно, что большинство современных моделей распознавания слов, которые утверждают, что связаны с лексическим доступом, на самом деле являются моделями распознавания слов. Небольшая работа, если вообще была посвящена описанию структуры и организации ментального лексикона (см., Однако, Johnson-Laird, 1975; Miller & Johnson-Laird, 1976).Более того, также должно быть очевидно, что предположения о распознавании слов и входных данных в лексикон, вероятно, не являются независимыми от предположений, сделанных о структуре и организации самого лексикона (см. Bradley & Forster, 1987, этот выпуск; Luce, 1986). Действительно, может быть сложно или невозможно отделить процессы распознавания слов и лексического доступа от их продуктов. Возьмем один пример: сегментация речевого сигнала на дискретные языковые единицы, такие как фонемы или слова, всегда была сложной проблемой из-за непрерывного характера речевого сигнала.Однако сегментация вполне может быть естественным побочным продуктом самого процесса распознавания (Reddy, 1976). По мере того, как мы узнаем больше об источниках вариабельности речи, становится ясно, что вариабельность речевых сигналов чрезвычайно систематична и потенциально весьма полезна для процесса распознавания (Church, 1983; Elman & McClelland, 1984). Действительно, недавние открытия Черча продемонстрировали, как знание аллофонических вариаций может помочь в фонологическом синтаксическом анализе и лексическом поиске и, следовательно, сократить процесс поиска при поиске правильной лексической статьи (см. Church, 1987, этот выпуск).

6. Модели распознавания слов

6.1. Теория логогена

В теории логогена Мортона (1969, 1979, 1982) пассивные сенсорные устройства, называемые «логогенами», представляют каждое слово в ментальном лексиконе. Каждый логоген содержит всю информацию о данном слове, такую ​​как его значение, его возможные синтаксические функции, а также его фонетическую и орфографическую структуру. Логоген отслеживает соответствующую сенсорную и / или контекстную информацию, и, как только такая информация встречается, уровень активации логогена повышается.После достаточной активации логоген пересекает порог, и в это время информация о слове, которое представляет логоген, становится доступной для системы ответа.

Одной из важных особенностей теории логогенов является то, что логогены отслеживают все возможные источники информации, включая семантическую и синтаксическую информацию более высокого уровня, а также сенсорную информацию более низкого уровня. Таким образом, информация с любого уровня может объединяться, чтобы подтолкнуть логоген к пороговому значению. Таким образом, теория логогена представляет собой интерактивную модель распознавания слов.Например, слово с высокой частотой, у которого начальный порог ниже, чем у слов с более низкой частотой, может потребовать очень небольшого сенсорного ввода, если синтаксические и семантические источники информации сильно отдают предпочтение слову. Точно так же слово низкой частоты с несколькими связанными с ним ожиданиями более высокого уровня может потребовать значительного сенсорного ввода для того, чтобы уровень активации достиг порога. Таким образом, на самом деле может не иметь значения, какая информация активирует логоген, если пороговое значение превышено.

Согласно теории логогена, распознавание слов выполняется, когда достигается порог активации логогена.Как мы видели, теория логогена изображает процесс распознавания слов как высоко интерактивный. Лексический доступ, согласно нашей терминологии, достигается, когда информация, содержащаяся в логогене, становится доступной для системы ответов. Таким образом, после распознавания слова лексический доступ - это довольно автоматический процесс. Интересно отметить, что на уровне распознавания слов задействованы не только интерактивные источники знаний, но и частота слов на этом этапе. Слова с более высокой частотой имеют более низкий порог активации, чем слова с более низкой частотой (см., Однако, Luce, 1986).

Конкретные детали теории логогена несколько изменились с годами, хотя основные механизмы остались неизменными. Например, Мортон (1982) недавно разбил систему логогена на отдельные зрительную и слуховую подсистемы. Тем не менее, фундаментальное понятие пассивного порогового устройства, отслеживающего информацию из множества источников, осталось. В нынешнем виде теория логогена, как и многие теории, которые мы обсудим, чрезвычайно расплывчата. В лучшем случае теория помогает понять, как может работать интерактивная система и как можно учесть частоту слов и контекстные эффекты при распознавании слов.Однако теория говорит очень мало, если вообще говорит о том, как именно интегрированы акустико-фонетические и высокоуровневые источники информации, о времени распознавания слов, природе единиц восприятия или роли лексикона в слове. признание.

6.2. Когортная теория

Когортная теория Марслена-Уилсона (Marslen-Wilson & Tyler, 1980; Marslen-Wilson & Welsh, 1978) предполагает две стадии процесса распознавания слов: одну автономную, а другую - интерактивную. На первом, автономном этапе распознавания слов, акустико-фонетическая информация в начале входного слова активирует все слова в памяти, которые разделяют эту исходную информацию слова.Например, если системе представлено слово «раб», активируются все слова, начинающиеся с / s /, такие как «прицел», «сохранить», «привязать» и так далее. Слова, активируемые на основе исходной информации слова, составляют «когорту». Активация когорты - это автономный процесс в том смысле, что только акустико-фонетическая информация может служить для определения членов когорты. Таким образом, на этом этапе модели распознавание слов является полностью управляемым данными или восходящим процессом.

Ключом к этому подходу является понятие набора «исходных когорт слов» или кандидатов распознавания, которые определяются акустико-фонетической общностью исходных звуковых последовательностей слов.Конкретное слово «распознается» в этой точке - «критической точке распознавания», где слово уникально отличается от любого другого слова на языке , которое начинается с той же начальной звуковой последовательности . Теория объясняет стимулирующие эффекты контекста при распознавании слов, предполагая, как в модели логогена Мортона, что контекст влияет на распознавание конкретного слова. Однако, в отличие от модели логогена, контекст используется для деактивации слов-кандидатов и, следовательно, для уменьшения размера начального набора когорт слов, который активен в любое время.Предполагается, что взаимодействие контекста с сенсорным входом происходит на уровне распознавания слов (см. Marslen-Wilson & Welsh, 1978). Предполагается, что обработка на ранних сенсорных уровнях происходит автоматически и не зависит от других источников информации более высокого порядка. В теории когорт набор исходных когорт слов, который активируется, в принципе определяется внутренней сегментарной структурой линейного расположения звуков речи. Сказать, как это сделал Марслен-Вильсон, что его теория не претендует на структуру входных данных в систему распознавания слов в терминах сегментарных представлений, значит просто отрицать существование предположения prima facie, которое является центральным для организации его слово начальный набор когорты.Теория в ее нынешней формулировке никогда не сработала бы, если бы внутреннюю структуру слов нельзя было формально описать как последовательность сегментных единиц.

Как только структура когорты активирована, все возможные источники информации могут повлиять на выбор подходящего слова из когорты. Таким образом, дополнительная акустико-фонетическая информация может исключить «зрение» и «спасти» из когорты, оставив только слова, начинающиеся с / sl /, такие как «праща» и «раб». Обратите внимание, что распознавание слов на основе акустико-фонетической информации предполагается работать строго слева направо.Однако на этом этапе распознавания слов могут быть задействованы источники информации более высокого уровня, чтобы исключить кандидатов из набора гипотетических когорт слов. Таким образом, если «привязка» несовместима с доступной в настоящее время семантической или синтаксической информацией, она будет исключена из когорты. На этом втором этапе распознавания слов теория очень интерактивна. После выделения одного слова в когорте распознавание слов выполняется.

Когортная теория Марслена-Вильсона привлекла значительное внимание в последние несколько лет, по-видимому, из-за относительно точного описания процесса распознавания слов, ее нового утверждения о том, что все слова в ментальном лексиконе разделяют исходную акустико-фонетическую информацию с входное слово активируется на начальном этапе процесса распознавания слов, и из-за приоритета, который он отдает началу слов, популярному понятию в литературе (см. также Cole & Jakimik, 1980).

Однако теория не лишена недостатков. Например, исходная версия когортной теории не включает механизма, с помощью которого можно было бы учесть частоту слов (см., Однако, Marslen-Wilson, 1987, этот выпуск). У высокочастотных слов более высокий уровень активации в структуре когорты, или же высокочастотные слова просто с большей вероятностью будут выбраны в качестве кандидатов в когорту, чем низкочастотные слова? Эта последняя возможность кажется маловероятной, поскольку тогда системе было бы трудно учесть распознавание низкочастотных слов, которые могут быть априори исключены из структуры когорты.Возможно, было бы более подходящим связать различные уровни активации со словами-кандидатами, но в нынешней теории нет средств для учета различных уровней активации.

Другая проблема когортной теории - исправление ошибок. Например, если «фундамент» воспринимается как «основание» из-за неправильного произношения или неправильного восприятия, когорта, начинающаяся со слова, не будет содержать слово-кандидат «основание». Марслен-Уилсон допускает примерно остаточную активацию акустически похожих слов-кандидатов в структуре когорты, поэтому второй проход через структуру когорты может быть возможным для попытки наилучшего совпадения, но в настоящее время теория не определяет, как такое отключение может быть выполнено восстановление ошибки линии.

6.3. Модель автономного поиска Форстера

В отличие от теории логогена Мортона и теории когорт Марслена-Уилсона, теория распознавания слов и лексического доступа Форстера (1976, 1979) автономна в самом строгом смысле. В то время как Мортон и Марслен-Уилсон допускают параллельную обработку информации на определенном этапе, в теории Форстера лингвистическая обработка является полностью последовательной. Теория Форстера постулирует три отдельных лингвистических процессора: лексический процессор, синтаксический процессор и процессор сообщений.Кроме того, последняя версия теории Форстера включает третий, неязыковой процессор, Систему общей обработки (GPS).

На первом этапе модели Форстера информация от периферийных систем восприятия передается в лексический процессор. Затем лексический процессор пытается найти запись в трех файлах периферийного доступа: орфографическом файле (для визуального ввода), фонетическом файле (для слухового ввода) и синтаксико-семантическом файле (как для визуального, так и для слухового ввода).Предполагается, что поиск файлов периферийного доступа осуществляется по частоте, при этом поиск слов с более высокой частотой выполняется до слов с более низкой частотой. Как только запись находится в файлах периферийного доступа, извлекается указатель, по которому эта запись находится в главном лексиконе. Таким образом, распознавание слов осуществляется на уровне файлов периферийного доступа. Как только запись находится в периферийных файлах, лексический доступ осуществляется путем нахождения записи в главном лексиконе.

При нахождении элемента в главном лексиконе информация, касающаяся местоположения этого элемента в главном списке, передается синтаксическому процессору, который пытается построить синтаксическую структуру.Информация от синтаксического процессора передается процессору сообщений, который пытается построить концептуальную структуру для предполагаемого сообщения. Каждый из трех процессоров - лексический процессор, синтаксический процессор и процессор сообщений - может передавать информацию в GPS. Однако GPS не может влиять на обработку ни в одном из трех выделенных лингвистических процессоров. GPS служит для объединения общих концептуальных знаний с выводом информации от лингвистических процессоров при принятии решения (или ответа).

Теория Форстера автономна в двух смыслах. Во-первых, лексический процессор не зависит от синтаксического процессора и процессора сообщений, а синтаксический процессор не зависит от процессора сообщений. Во-вторых, вся языковая система не зависит от общей когнитивной системы. Эта строго последовательная и автономная характеристика языковой обработки означает, что распознавание слов и лексический доступ никоим образом не зависят от источников знаний более высокого уровня и являются исключительно восходящими или управляемыми данными процессами.Модель Форстера привлекательна своей относительной специфичностью и очевидными проверяемыми утверждениями, которые она делает относительно автономности своих процессоров. Модель Форстера также пытается описать распознавание слов и лексический доступ в контексте обработки предложений. Кроме того, модель включает в себя конкретное объяснение эффекта частоты слов, а именно то, что записи в файлах периферийного доступа организованы в соответствии с частотой и что поиск осуществляется от высокочастотных записей к низкочастотным.

6.4. Теория интерактивной активации Элмана и Макклелланда

Модель Элмана и Макклелланда (1984, 1986) основана на системе простых процессоров, называемых «узлами». Узлы могут означать функции, фонемы или слова. Однако узлы на каждом уровне схожи в том, что каждый имеет уровень активации, представляющий степень, в которой входные данные согласуются с единицей, которую обозначает узел. Кроме того, каждый узел имеет уровень покоя и порог. При наличии подтверждающих свидетельств уровень активации узла повышается до его порогового значения; в отсутствие таких доказательств активация затухает к уровню покоя узла (см. также McClelland & Rumelhart, 1981).

Узлы в этой системе сильно взаимосвязаны, и когда данный узел достигает порогового значения, он может влиять на другие узлы, к которым он подключен. Связи между узлами бывают двух типов: возбуждающие и тормозящие. Таким образом, узел, достигший порогового значения, может повысить активацию некоторых узлов, к которым он подключен, одновременно снизив активацию других узлов. Связи между уровнями исключительно возбуждающие и двунаправленные. Таким образом, узлы фонем могут возбуждать узлы слов, а узлы слов могут, в свою очередь, возбуждать узлы фонем.Например, узлы фонем, соответствующие / l / и / e /, могут возбуждать узел слова «озеро», а узел слова «озеро» может затем возбуждать узлы фонем / l /, / e / и / k /. Соединения на уровнях являются запрещающими и двунаправленными. Таким образом, активация узла фонемы / l / может препятствовать активации узла фонемы / b / , , снижая вероятность того, что слово узел «запекать» повысит уровень его активации.

Модель Элмана и Макклелланда иллюстрирует, как можно концептуализировать высоко интерактивную систему (см. Также McClelland & Elman, 1986).Кроме того, он включает понятия возбуждения и подавления . Таким образом, он напрямую включает механизм, который снижает вероятность того, что узлы, несовместимые со свидетельством, будут активированы, и в то же время позволяет положительным свидетельствам на одном уровне влиять на активацию узлов на другом. Хотя модель Элмана и Макклелланда очень интерактивна, она не лишена ограничений. А именно, связи между уровнями являются только возбуждающими, а внутри уровней - только тормозящими.

Модель Элмана и Макклелланда явно предполагает сегментное представление речи. Вся организация сети основана на существовании различных блоков обработки на каждом уровне, соответствующих акустико-фонетическим характеристикам или репликам, сегментарным фонемам и, наконец, словам. Из-за архитектуры системы слова имеют гораздо более сложную структуру, чем другие элементы. Таким образом, словарные узлы отражают не только активацию слова в целом, но также активацию каждой из составляющих фонем слова и их компонентов.

Здесь стоит отметить две интересные особенности данной модели. Во-первых, хотя эффекты коартикуляции и контекстная изменчивость рассматривались теоретиками как «шум», который налагается на идеальную дискретную фонетическую транскрипцию речи речевым аппаратом, модель Элмана и МакКлелланда рассматривает эту изменчивость, то, что они называют «законной изменчивостью», как источник полезной информации и обеспечивает «изящный» способ учесть влияние контекста на восприятие речи (Elman & McClelland, 1984).Во-вторых, нет явной сегментации входной речевой волны в любой момент во время обработки в их модели. Сегментация на телефоны или аллофоны просто выпадает естественным образом в результате самого процесса маркировки. Таким образом, проблема непосредственной работы с сегментацией устраняется, разрешая активацию всех узлов признаков и фонем и просто наблюдая последствия на уровне слов.

6.5. Модель Клатта LAFS

В то время как модель Элмана и Макклелланда допускает взаимодействие между уровнями узлов и внутри них, модель Клатта L exical A ccess F rom S pectra (LAFS) предполагает прямой, неинтерактивный доступ к лексическим записям на основе на контекстно-зависимых спектральных разрезах (Klatt, 1980).Модель Клатта предполагает, что взрослые слушатели имеют словарь всех законных дифонных последовательностей в долговременной памяти. С каждой дифонной последовательностью связано прототипное спектральное представление. Клатт предлагает спектральные представления дифонных последовательностей, чтобы преодолеть контекстную изменчивость отдельных сегментов. Таким образом, в определенной степени Клатт пытается преодолеть проблему отсутствия акустико-фонетической инвариантности речи путем предварительной компиляции коартикуляционных эффектов непосредственно в репрезентации, хранящиеся в памяти.

В модели Клатта LAFS слушатель вычисляет спектральные представления входного слова и сравнивает эти представления с прототипами в памяти. Распознавание слов выполняется, когда обнаруживается наилучшее совпадение между входными спектрами и изображениями дифонов. В этой части модели распознавание слов осуществляется непосредственно на основе спектральных представлений сенсорного ввода. Существует средство, с помощью которого фонетическая транскрипция может быть получена от промежуточного до лексического доступа (т.е., через модуль SCRIBER), но в большинстве случаев доступ является прямым, без промежуточных уровней вычислений, соответствующих сегментам или фонемам.

Одним из важных аспектов модели LAFS Клатта является то, что она явно избегает необходимости вычислять отдельный уровень представления, соответствующий дискретным фонематическим сегментам. Вместо этого LAFS использует предварительно скомпилированную, основанную на акустике лексику всех возможных слов в сети спектров мощности дифонов. Предполагается, что эти спектральные шаблоны являются контекстно-зависимыми единицами, очень похожими на «виклфоны», поскольку предполагается, что они представляют акустические корреляты телефонов в различных фонетических средах (Wickelgren, 1969).Дифоны в системе LAFS достигают этого путем кодирования спектральных характеристик самих сегментов и переходов от середины одного сегмента к середине следующего сегмента.

Клатт утверждает, что конкатенации дифонов достаточно, чтобы уловить большую часть контекстно-зависимой изменчивости, наблюдаемой для фонетических сегментов в произносимых словах. Распознавание слов в этой модели выполняется путем вычисления спектра мощности входного речевого сигнала каждые 10 мс и последующего сравнения этого входного спектра со спектральными шаблонами, хранящимися в предварительно скомпилированной сети.Основная идея LAFS, адаптированная из системы Harpy, состоит в том, чтобы найти путь через сеть, который лучше всего представляет наблюдаемые входные спектры (Klatt, 1977). Затем предполагается, что этот единственный путь представляет оптимальную фонетическую транскрипцию входного сигнала.

Модели Элмана, Макклелланда и Клатта находятся на обоих концах континуума теорий распознавания слов и лексического доступа. Теория Элмана и Мак-Клелланда представляет собой класс теорий, которые выделяют интерактивные системы , в которых много разных уровней информации играют роль в распознавании слов и лексическом доступе.В этом смысле их модель наиболее близка к моделям Мортона и Марслена-Вильсона, хотя когортная теория Марслена-Вильсона действительно включает начальную автономную стадию обработки. Модель Клатта, с другой стороны, представляет собой класс моделей, в которых лексический доступ осуществляется почти полностью на основе восходящей акустико-фонетической информации. В этом смысле модель Клатта напоминает подход Форстера. Однако модель Форстера действительно постулирует промежуточные уровни анализа в процессе распознавания слов, в отличие от LAFS Клатта, которая предполагает прямое отображение спектров мощности на слова в предварительно скомпилированной сети.Один из центральных вопросов, который необходимо решить в отношении современных теорий распознавания слов, связан с тем, в какой степени распознавание слов включает интерактивные источники знаний и каким образом эти процессы взаимодействуют с процессами, участвующими в восприятии звуков речи (см. Другие материалы по этому вопросу). .

7. Резюме и выводы

В этой статье мы попытались кратко рассмотреть то, что в настоящее время известно о природе входных данных в систему распознавания слов, обеспечиваемых механизмами, используемыми в восприятии звуков речи.После рассмотрения нескольких основных вопросов восприятия речи, таких как линейность, инвариантность и сегментация, мы описали несколько этапов перцептивного анализа в рамках концептуальной основы. Эта структура предполагала, что речь обрабатывается через ряд аналитических этапов, начиная от периферической слуховой обработки, акустико-фонетического и фонологического анализа до распознавания слов и лексического доступа. Наконец, мы рассмотрели несколько современных подходов к распознаванию слов, чтобы сделать явными некоторые из основных предположений относительно природы входных данных в процесс распознавания слов.Дополнительная цель статьи заключалась в установлении потребности в сегментарных фонематических репрезентациях при распознавании устных слов. Это точка обработки разговорной речи, которая служит для сопряжения исходной сенсорной информации в форме речевого сигнала с представлением слов в лексиконе. Изучение текущих моделей показало, в какой степени сегментарные представления предполагаются явным или неявным образом при опосредовании распознавания слов и лексического доступа.

Сноски

* Подготовка этого документа была частично поддержана исследовательским грантом NIH NS-12179, контрактом с Управлением научных исследований ВВС, Командованием систем ВВС и стипендией Фонда Джеймса МакКина Кеттелла. первому автору.Мы благодарим Говарда Нусбаума, Бет Грин и Роберта Ремеза за их комментарии и предложения. Мы также благодарим рецензентов за множество полезных предложений по более раннему варианту этой статьи.

Ссылки

  • Abbs JH, Sussman HM. Детекторы нейрофизиологических особенностей и восприятие речи: обсуждение теоретических последствий. Журнал исследований речи и слуха. 1971; 14: 23–36. [PubMed] [Google Scholar]
  • Абрамсон А.С., Лискер Л. Время начала голоса в стоп-согласных: акустический анализ и синтез.Материалы 5-го Международного акустического конгресса; Вассал. 1965. [Google Scholar]
  • Аллен Дж. Взгляд на общение человека с машиной посредством речи. Труды IEEE. 1985. 74 (11): 1541–1550. [Google Scholar]
  • Аслин Р.Н., Писони Д.Б., Ючик П.В. Слуховое развитие и восприятие речи в младенчестве. В: Массен П., редактор. Руководство Кармайкла по детской психологии. 4. 2 1983. [Google Scholar]
    Haith MM, Campos JJ, editors. Младенчество и биология развития.Vol. 2. Нью-Йорк: Уайли; [Google Scholar]
  • Бевер Т.Г., Лакнер Дж., Кирк Р. Базовые структуры предложений являются основными единицами непосредственной обработки речи. Восприятие и психофизика. 1969; 5: 225–231. [Google Scholar]
  • Бонд З.С., Гарнес С. Неправильное восприятие беглой речи. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Bond ZS, Robey RR. Фонетическая структура ошибок восприятия беглой речи.В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики. Vol. 9. Нью-Йорк: Academic Press; 1983. [Google Scholar]
  • Bradley DC, Forster KI. Взгляд читателя на слушание. Познание. 1987; 25 в этом выпуске. [PubMed] [Google Scholar]
  • Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе. Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Хомский Н., Халле М. Звуковой паттерн английского языка. Нью-Йорк: Харпер и Роу; 1968 г.[Google Scholar]
  • Хомский Н., Миллер Г.А. Введение в формальный анализ естественных языков. В: Люс Р.Д., Буш Р., Галантер Э., редакторы. Справочник по математической психологии. Vol. 2. Нью-Йорк: Уайли; 1963. [Google Scholar]
  • Church KW. Анализ структуры фраз: метод использования аллофонических ограничений. Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1983. [Google Scholar]
  • Church KW. Фонологический разбор и лексический поиск. Познание.1987; 25 в этом выпуске. [PubMed] [Google Scholar]
  • Clements GN, Keyser SJ. Фонология резюме: генеративная теория слога. Кембридж, Массачусетс: MIT Press; 1983. [Google Scholar]
  • Cole RA. Прослушивание неправильного произношения: мера того, что мы слышим во время речи. Восприятие и психофизика. 1973; 13: 153–156. [Google Scholar]
  • Коул Р.А., Джакимик Дж. Понимание речи: как слышны слова. В: Андервуд Дж., Редактор. Стратегии обработки информации. Нью-Йорк: Academic Press; 1978 г.[Google Scholar]
  • Коул Р.А., Якимик Дж. Модель восприятия речи. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Коул Р.А., Скотт Б. Фантом в фонеме: инвариантные сигналы для стоп-согласных. Восприятие и психофизика. 1974а; 15: 101–107. [Google Scholar]
  • Коул Р.А., Скотт Б. К теории восприятия речи. Психологический обзор. 1974b; 81: 348–374. [PubMed] [Google Scholar]
  • Конрад Р.Акустические спутанности в непосредственной памяти. Британский журнал психологии. 1964; 55: 75–84. [Google Scholar]
  • Cooper WE. Избирательная адаптация к речи. В: Restle F, Shiffrin RM, Castellan NJ, Lindman HR, Pisoni DB, редакторы. Когнитивная теория. Vol. 1. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1975. [Google Scholar]
  • Darwin DJ. Восприятие речи. В: Carterette EC, Friedman MP, редакторы. Справочник восприятия. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Delattre PC, Liberman AM, Cooper FS.Акустические локусы и переходные подсказки для согласных. Журнал Акустического общества Америки. 1955; 27: 769–773. [Google Scholar]
  • Delgutte B. Представление звуков, похожих на речь, в паттернах разряда волокон слухового нерва. Журнал Акустического общества Америки. 1980; 68: 843–857. [PubMed] [Google Scholar]
  • Delgutte B. Некоторые корреляты фонетических различий на уровне слухового нерва. В: Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе.Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Dell GS, Newman JE. Обнаружение фонем в беглой речи. Журнал вербального обучения и вербального поведения. 1980; 19: 608–623. [Google Scholar]
  • Денес П. Влияние длительности на восприятие голоса. Журнал Акустического общества Америки. 1955; 27: 761–764. [Google Scholar]
  • Diehl RL. Детекторы функций для речи: критическая переоценка. Психологический бюллетень. 1981; 89: 1–18. [PubMed] [Google Scholar]
  • Дорман М., Стаддерт-Кеннеди М., Рафаэль Л.Прекращение распознавания согласных: выпуск пакетов и переходов формант как функционально эквивалентных контекстно-зависимых сигналов. Восприятие и психофизика. 1977; 22: 109–122. [Google Scholar]
  • Eimas PD. Слуховая и лингвистическая обработка сигналов о месте артикуляции у младенцев. Восприятие и психофизика. 1974; 16: 513–521. [Google Scholar]
  • Eimas PD, Corbit JD. Выборочная адаптация детекторов лингвистических признаков. Когнитивная психология. 1973; 4: 99–109. [Google Scholar]
  • Eimas PD, Miller JL.Влияние избирательной адаптации на восприятие речи и зрительных образов: данные для детекторов функций. В: Pick HL, Walk RD, редакторы. Восприятие и опыт. Нью-Йорк: Пленум; 1978. [Google Scholar]
  • Eimas PD, Siqueland ER, Jusczyk P, Vigorito J. Восприятие речи у младенцев. Наука. 1971; 171: 303–306. [PubMed] [Google Scholar]
  • Элман Дж. Л., Макклелланд Дж. Л.. Использование законной изменчивости формы сигнала речи. В: Perkell JS, Klatt DH, редакторы. Инвариантность и вариативность речевых процессов.Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1986. [Google Scholar]
  • Elman JL, McClelland JL. Восприятие речи как познавательный процесс: модель интерактивной активации. В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики. Vol. 10. Нью-Йорк: Academic Press; 1984. С. 337–374. [Google Scholar]
  • Фант Г. Описательный анализ акустических аспектов речи. Логотипы. 1962; 5: 3–17. [PubMed] [Google Scholar]
  • Фант Г. Звуки и особенности речи. Кембридж, Массачусетс: MIT Press; 1973 г.[Google Scholar]
  • Фишер-Йоргенсен Э. Акустический анализ стоп-согласных. Miscellanea Phonetica. 1954; 2: 42–59. [Google Scholar]
  • Fitch HL. Отчет о статусе исследований речи лабораторий Хаскинс. СР-65. Нью-Хейвен: лаборатории Хаскинса; 1981. Отличие временной информации для скорости речи от временной информации для интервокальной остановки согласного голоса; С. 1–32. [Google Scholar]
  • Forster KI. Доступ к ментальному лексикону. В: Wales RJ, Walker E, editors.Новые подходы к языковым механизмам. Амстердам: Северная Голландия; 1976. [Google Scholar]
  • Forster KI. Уровни обработки и структура языкового процессора. В: Cooper WE, Walker ECT, редакторы. Обработка предложений: психолингвистические исследования представлены Мерриллу Гарретту. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1979. [Google Scholar]
  • Foss DJ, Blank MA. Определение речевых кодов. Когнитивная психология. 1980; 12: 1–31. [PubMed] [Google Scholar]
  • Фосс Д. Д., Гернсбахер Массачусетс.Взлом двойного кода: к единой модели идентификации фонем. Журнал вербального обучения и вербального поведения. 1983; 22: 609–632. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Foss DJ, Harwood DA, Blank MA. Расшифровка решений декодирования: Данные и устройства. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Foss DJ, Swinney DA. О психологической реальности фонемы: восприятие, идентификация и сознание.Журнал вербального обучения и вербального поведения. 1973; 12: 246–257. [Google Scholar]
  • Фромкин В. Речевые ошибки как лингвистические доказательства. Гаага: Мутон; 1973. [Google Scholar]
  • Фромкин В. Ошибки в языковой деятельности. Нью-Йорк: Academic Press; 1980. [Google Scholar]
  • Fry DW. Восприятие и узнавание. В: Halle M, Lunt HG, McClean H, van Schoonefeld CH, редакторы. Для Романа Якобсона. Гаага: Мутон; 1956. [Google Scholar]
  • Ganong WF. Избирательные эффекты импульсных остановок.Восприятие и психофизика. 1978; 24: 71–83. [PubMed] [Google Scholar]
  • Гарретт М.Ф. Синтаксические процессы в производстве предложений. В: Wales RJ, Walker E, editors. Новые подходы к языковым механизмам. Амстердам: Северная Голландия; 1976. [Google Scholar]
  • Garrett MF. Уровни обработки в производстве предложений. В: Баттерворт Б., редактор. Языковая продукция. Vol. 1. Нью-Йорк: Academic Press; 1980. [Google Scholar]
  • Goldhor R. Система обработки речевого сигнала, основанная на модели периферического слуха.Труды IEEE. 1983; 1CASSP-83: 1368–1371. [Google Scholar]
  • Halle M. Рассуждения о представлении слов в памяти. В: Фромкин В., редактор. Лингвистическая фонетика: доклады, представленные Питеру Ладефогеду. Нью-Йорк: Academic Press; 1985. [Google Scholar]
  • Halle M, Vergnaud JR. Трехмерная фонология. Журнал лингвистических исследований. 1980; 1: 83–105. [Google Scholar]
  • House AS. О продолжительности гласных. Журнал Акустического общества Америки. 1961; 33: 1174–1178.[Google Scholar]
  • Johnson-Laird PN. Смысл и ментальный лексикон. В: Кеннеди А., Уилкс А., редакторы. Исследования долговременной памяти. Лондон: Wiley; 1975. С. 123–142. [Google Scholar]
  • Джус М.А. Акустическая фонетика. Язык. 1948; 24 (Дополнение): 1–136. [Google Scholar]
  • Кан Д. Слоговые обобщения в английской фонологии. Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1976. [Google Scholar]
  • Kenstowicz M, Kisseberth C. Генеративная фонология.Нью-Йорк: Academic Press; 1979. [Google Scholar]
  • Klatt DH. Структура путаницы в кратковременной памяти между английскими согласными. Журнал Акустического общества Америки. 1968; 44: 401–407. [PubMed] [Google Scholar]
  • Клатт DH. Обзор проекта по пониманию речи ARPA. Журнал Акустического общества Америки. 1977; 62: 1345–1366. [Google Scholar]
  • Klatt DH. Восприятие речи: модель акустико-фонетического анализа и лексического доступа. Журнал фонетики.1979; 7: 279–312. [Google Scholar]
  • Klatt DH. Восприятие речи: модель акустико-фонетического анализа и лексического доступа. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Klatt DH. Стратегии обработки речи на основе слуховых моделей. В: Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе. Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Liberman AM, Cooper FS, Shankweiler DP, Studdert-Kennedy M.Восприятие речевого кода. Психологический обзор. 1967; 74: 431–461. [PubMed] [Google Scholar]
  • Либерман AM, Delattre PC, Cooper FS. Роль выбранных переменных стимула в восприятии глухих согласных звуков. Американский журнал психологии. 1952; 52: 127–137. [PubMed] [Google Scholar]
  • Либерман AM, Delattre PC, Cooper FS, Gerstman LH. Роль переходов согласный-гласный в восприятии стоповых и носовых согласных. Психологические монографии. 1954; 68: 1–13.[Google Scholar]
  • Либерман И.Ю., Шанквейлер Д., Фишер Ф.В., Картер Б. Явная сегментация слогов и фонем у маленьких детей. Журнал экспериментальной детской психологии. 1974; 18: 201–212. [Google Scholar]
  • Лискер Л. Продолжительность закрытия и различие между голосом и глухотой в английском языке. Язык. 1957; 33: 42–49. [Google Scholar]
  • Отчет Лаборатории Лискера Л. Хаскинса о статусе исследования речи. СР-65. Нью-Хейвен: лаборатории Хаскинса; 1978. Rapid vs rabid: каталог акустических характеристик, которые могут указывать на различие; стр.127–132. [Google Scholar]
  • Лискер Л., Абрамсон А.С. Межъязыковое исследование озвучивания в начальных остановках: акустические измерения. Слово. 1964; 20: 384–422. [Google Scholar]
  • Luce PA. Исследование восприятия речи, технический отчет № 6. Блумингтон, штат Индиана: Департамент психологии, Лаборатория исследования речи; 1986. Окрестности слов в ментальном лексиконе. [Google Scholar]
  • Marslen-Wilson WD. Параллельная обработка речи при распознавании слов. Познание. 1987; 25 в этом выпуске.[PubMed] [Google Scholar]
  • Марслен-Уилсон В.Д., Тайлер Л.К. Временная структура понимания разговорной речи. Познание. 1980; 8: 1–71. [PubMed] [Google Scholar]
  • Марслен-Уилсон У. Д., Уэлш А. Обработка взаимодействий и лексический доступ во время распознавания слов в непрерывной речи. Когнитивная психология. 1978; 10: 29–63. [Google Scholar]
  • Massaro DW, Oden GC. Восприятие речи: рамки для исследований и теории. В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики.Vol. 3. Нью-Йорк: Academic Press; 1980. С. 129–165. [Google Scholar]
  • McClelland JL, Elman JL. Модель восприятия речи TRACE. Когнитивная психология. 1986; 18: 1–86. [PubMed] [Google Scholar]
  • McClelland JL, Rumelhart DE. Модель интерактивной активации контекстных эффектов в восприятии букв, Часть I: Изложение основных результатов. Психологический обзор. 1981; 88: 375–407. [Google Scholar]
  • Miller GA. Единицы принятия решений в восприятии речи. Сделки IRE по теории информации.1962; ИТ-8: 81–83. [Google Scholar]
  • Miller GA, Johnson-Laird PN. Язык и восприятие. Кембридж, Массачусетс: издательство Гарвардского университета; 1976. [Google Scholar]
  • Miller GA, Nicely PE. Анализ путаницы восприятия некоторых английских согласных. Журнал Акустического общества Америки. 1955; 27: 338–352. [Google Scholar]
  • Миллер М.И., Сакс МБ. Представление стоп-согласных в образцах разряда волокон слухового нерва. Журнал Акустического общества Америки.1983; 74: 502–517. [PubMed] [Google Scholar]
  • Мортон Дж. Взаимодействие информации при распознавании слов. Психологический обзор. 1969; 76: 165–178. [Google Scholar]
  • Мортон Дж. Распознавание слов. В: Мортон Дж., Маршалл Дж. Д., редакторы. Психолингвистика 2: Структуры и процессы. Кембридж, Массачусетс: MIT Press; 1979. С. 107–156. [Google Scholar]
  • Мортон Дж. Распад словарного запаса: подход к обработке информации. В: Mehler J, Walker E, Garrett M, редакторы. О мысленном представлении.Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1982. [Google Scholar]
  • Мортон Дж., Лонг Дж. Влияние вероятности перехода слова на идентификацию фонем. Журнал вербального обучения и вербального поведения. 1976; 15: 43–52. [Google Scholar]
  • Oshika BT, Zue VW, Weeks RV, Neu H, Aurbach J. Роль фонологических правил в исследованиях понимания речи. Транзакции IEEE по акустической речи и обработке сигналов, ASSP-1975; 23: 104–112. [Google Scholar]
  • Pisoni DB. Восприятие речи. В: Эстес В.К., редактор.Справочник по обучению и познавательным процессам. Vol. 6. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1978. [Google Scholar]
  • Pisoni DB. В защиту сегментарных представлений при обработке речи. Журнал Акустического общества Америки. 1983; 69: S32. [Google Scholar]
  • Pisoni DB. Восприятие речи: некоторые новые направления в исследованиях и теории. Журнал Акустического общества Америки. 1985; 78: 381–388. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Pisoni DB, Nusbaum HC, Luce PA, Slowiaczek LM.Восприятие речи, распознавание слов и структура лексики. Речевое общение. 1985. 4: 75–95. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Pisoni DB, Sawusch JR. Некоторые этапы обработки в восприятии речи. В: Коэн А., Ноутебум С., редакторы. Структура и процесс восприятия речи. Гейдельберг: Springer-Verlag; 1975. С. 16–34. [Google Scholar]
  • Порт РФ. Влияние темпа речи на длительность ударной гласной и медиальной остановки в английских хорейных словах.Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1977 г. [Google Scholar]
  • Порт РФ. Влияние темпа на длительность закрытия стопа как сигнал для озвучивания и места. Журнал фонетики. 1979; 7: 45–56. [Google Scholar]
  • Raphael LJ. Длительность предшествующих гласных как сигнал к восприятию характеристик голоса согласных в конце слова в американском английском. Журнал Акустического общества Америки. 1972; 51: 1296–1303. [PubMed] [Google Scholar]
  • Рафаэль Л.Дж., Дорман М.Ф.Молчание как сигнал к восприятию согласных, состоящих из начала и конца слога. Журнал фонетики. 1980; 8: 269–275. [Google Scholar]
  • Прочтите C. Знание фонологии английского языка детьми дошкольного возраста. Harvard Educational Review. 1971; 41: 1–34. [Google Scholar]
  • Reddy DR. Распознавание речи машиной: обзор. Труды IEEE. 1976; 64: 501–523. [Google Scholar]
  • Ремез RE. Адаптация границы категорий между речью и неречием: аргументы против детекторов признаков.Когнитивная психология. 1979; 11: 38–57. [PubMed] [Google Scholar]
  • Розин П., Глейтман Л.Р. Структура и овладение чтением II: процесс чтения и освоение алфавитного принципа. В: Ребер А.С., Скарборо Д.Л., редакторы. К психологии чтения. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1977 г. [Google Scholar]
  • Sachs MB, Young ED. Кодирование устойчивых гласных в слуховом нерве: представление с точки зрения скорости разряда. Журнал Акустического общества Америки.1979; 66: 470–479. [PubMed] [Google Scholar]
  • Samuel AG. Восстановление фонематики: выводы из новой методологии. Журнал экспериментальной психологии: Общие. 1981a; 110: 474–494. [PubMed] [Google Scholar]
  • Samuel AG. Роль восходящего подтверждения в иллюзии восстановления фонемы. Журнал экспериментальной психологии: человеческое восприятие и производительность. 1981b; 7: 1124–1131. [PubMed] [Google Scholar]
  • Сапир Э. Психологическая реальность фонем. В: Мандельбаум Д., редактор.Избранные произведения Эдварда Сепира. Беркли: Калифорнийский университет Press; 1963. [Google Scholar]
  • Sawusch JR. Периферические и центральные процессы в избирательной адаптации места артикуляции стоп-согласных. Журнал Акустического общества Америки. 1977a; 62: 738–750. [PubMed] [Google Scholar]
  • Sawusch JR. Обработка размещает информацию в стоп-согласных. Восприятие и психофизика. 1977b; 22: 417–426. [Google Scholar]
  • Sawusch JR, Jusczyk PW. Адаптация и контраст в восприятии озвучивания.Журнал экспериментальной психологии: человеческое восприятие и производительность. 1981; 7: 408–421. [PubMed] [Google Scholar]
  • Сирл К.Л., Якобсон Дж. Ф., Реймент С. Г.. Прекратить различение согласных на основе человеческого прослушивания. Журнал Акустического общества Америки. 1979; 65: 799–809. [PubMed] [Google Scholar]
  • Селкирк Э. Роль просодических категорий в словесном ударении в английском языке. Лингвистический запрос. 1980; 11: 563–603. [Google Scholar]
  • Shattuck-Hufnagel S, Klatt DH. Ограниченное использование отличительных черт и маркировки в производстве речи: доказательства из данных ошибок речи.Журнал вербального обучения и вербального поведения. 1979; 18: 41–45. [Google Scholar]
  • Stemberger JP. Неопубликованная докторская диссертация. Калифорнийский университет; Сан-Диего: 1982. Лексика в модели языкового производства. [Google Scholar]
  • Стивенс К.Н. Акустические корреляты некоторых фонетических категорий. Журнал Акустического общества Америки. 1980; 68: 836–842. [PubMed] [Google Scholar]
  • Стивенс К.Н., Блюмштейн С.Е. Неизменные признаки места артикуляции в стоп-согласных.Журнал Акустического общества Америки. 1978; 64: 1358–1368. [PubMed] [Google Scholar]
  • Стивенс К.Н., Блюмштейн С.Е. Поиск инвариантных акустических коррелятов фонетических признаков. В: Эймас П.Д., Миллер Дж.Л., редакторы. Перспективы изучения речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1981. [Google Scholar]
  • Стивенс К.Н., Клатт Д.Х. Роль формантных переходов в различении голоса и голоса для остановок. Журнал Акустического общества Америки. 1974; 55: 653–659. [PubMed] [Google Scholar]
  • Стивенс К.Н., House AS.Восприятие речи. В: Тобиас Дж., Редактор. Основы современной слуховой теории. II. Нью-Йорк: Academic Press; 1972. [Google Scholar]
  • Студдерт-Кеннеди М. Восприятие речи. В: Себеок Т.А., редактор. Современные тенденции в лингвистике. Гаага: Мутон; 1974. [Google Scholar]
  • Стаддерт-Кеннеди М. Восприятие речи. В: Lass NJ, редактор. Современные проблемы экспериментальной фонетики. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Стаддерт-Кеннеди М. Восприятие речи.Язык и речь. 1980; 23: 45–66. [PubMed] [Google Scholar]
  • Саммерфилд К., Хаггард, член парламента. Перцепционная обработка нескольких сигналов и контекстов: эффекты следующей гласной после прекращения произнесения согласных. Журнал фонетики. 1974; 2: 279–295. [Google Scholar]
  • Трейман Р. Неопубликованная докторская диссертация. Пенсильванский университет; 1980. Способность дошкольников к фонематическому анализу. [Google Scholar]
  • Трейман Р. Структура разговорных слогов: данные из новых словесных игр.Познание. 1983; 15: 49–74. [PubMed] [Google Scholar]
  • Трейман Р. Началы и рифы как единицы произносимых слогов: свидетельства детей. Журнал экспериментальной детской психологии. 1985; 39: 161–181. [PubMed] [Google Scholar]
  • Wang MD, Bilger RC. Путаница согласных в шуме: исследование особенностей восприятия. Журнал Акустического общества Америки. 1973; 54: 1248–1266. [PubMed] [Google Scholar]
  • Уоррен Р.М. Восприятие утраченных звуков речи. Наука.1970; 176: 392–393. [PubMed] [Google Scholar]
  • Викельгрен, Вашингтон. Акустическое сходство и ретроактивная интерференция в кратковременной памяти. Журнал вербального обучения и вербального поведения. 1965; 4: 53–61. [Google Scholar]
  • Викельгрен WA. Фонематическое сходство и интерференция в кратковременной памяти для отдельных букв. Журнал экспериментальной психологии. 1966; 71: 396–404. [PubMed] [Google Scholar]
  • Викельгрен, Вашингтон. Контекстно-зависимое кодирование, ассоциативная память и последовательный порядок в (речевом) поведении.Психологический обзор. 1969; 76: 1–15. [Google Scholar]
  • Викельгрен WA. Фонетическая кодировка и порядковый номер. В: Carterette EC, Friedman MP, редакторы. Справочник восприятия. Vol. 7. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Young ED, Sachs MB. Представление устойчивых гласных во временных аспектах паттернов разряда популяций слуховых нервных волокон. Журнал Акустического общества Америки. 1979; 66: 1381–1403. [PubMed] [Google Scholar]
  • Цвикер Э., Терхардт Э., Паулюс Э.Автоматическое распознавание речи с использованием психоакустических моделей. Журнал Акустического общества Америки. 1979; 65: 487–498. [PubMed] [Google Scholar]

Фонема - обзор | Темы ScienceDirect

Историческая справка

Таксономическая фонема тесно связана с алфавитным представлением речи и отражает свойства греческого алфавита и многих алфавитов, которые были на его основе. Греческий алфавит остается источником некоторых фундаментальных предположений о речи, таких как представление о том, что разговорный язык может быть сегментирован на дискретные фонетические единицы и что речь может быть адекватно представлена ​​с помощью специальных букв для расшифровки каждой из этих фонетических единиц.В качестве теоретической концепции буква является очень грубой, но практически полезной, и, учитывая различие между согласными и гласными, становится возможным говорить о слогах, что приводит к структуре слов и даже к словесному ударению.

Различие между формой буквы и ее звуком или «голосом» было знакомо со времен средневековья, а концепция звука речи была прояснена в 16 веке, сначала благодаря реконструкции произношения древнегреческого языка Эразмом, а позже трудами английских реформаторов правописания.Изучение звуков речи было развито в 19 веке, и к концу века существовало две разные традиции. Доминирующей традицией было изучение звуковых изменений, что привело к великому триумфу филологии. К 1870-м годам филологи начали конструировать то, что они считали совокупностью научных знаний, с явными здравыми законами и доказательствами. Их представления включали символы не только звуков речи, но и абстрактных сущностей, которые, как считалось, когда-то в прошлом соответствовали звукам речи.Их величайшим достижением было создание алгоритмов сопоставления между различными стадиями одного и того же языка (которые, как они считали, воспроизводили исторические звуковые изменения), что привело к косвенным, но явным заявлениям о фонологических отношениях между родственными диалектами и языками. Другая традиция была связана с тщательным изучением самих звуков речи и частично мотивировалась необходимостью понимать звуковые изменения. Ко времени Генри Свита фонетики могли сегментировать речь гораздо точнее, чем буквы системы письма, и даже эти более мелкие сегменты, например.g., части дифтонга или стадии закрытия-удержания-отпускания стопа могут иметь точное описание. Подробное представление речи, которое Свит называл «узкой транскрипцией», содержало гораздо больше деталей, необходимых для общего лингвистического описания, и становилось все труднее согласовывать с алфавитным представлением о речи. Опыт, необходимый для узкой транскрипции, был разработан в Великобритании в традициях импрессионистической фонетики, процветавшей до 1960-х годов, и был обогащен изучением акустической фонетики.При детальном изучении фонетики стало ясно, что речь включает в себя артикуляционные жесты, которые накладываются сложным образом, что несовместимо с простым алфавитным представлением о речи.

К концу XIX века речь обычно представлялась на трех уровнях: на очень абстрактном уровне филологических «реконструкций», на уровне звуков речи и на уровне узкой транскрипции. Интуитивное представление о том, что речь состоит из звуков речи, было исследовано в XX веке.«Широкая транскрипция» Свита представляла речь на уровне, удобном для общих лингвистических целей, и была развита в практические фонематические транскрипции 20-го века, такие как та, которая использовалась для английского словаря произношения Дэниела Джонса . Практическая транскрипция также использовалась для создания систем письма для ранее ненаписанных языков, как провозглашается в книге Кеннета Пайка о фонемах, вышедшей в 1947 году и озаглавленной «Методика сведения языков к письму».'

Проблема, известная филологам, но обычно не принимаемая во внимание возникающей теорией фонем, заключалась в том, что было трудно согласовать фонемы со звуковыми изменениями. В некоторых случаях введение фонематического уровня усложняло объяснение. Например, в древнеанглийском языке / f / озвучивался как [v] между гласными, как в wifas «жены», но оставался в конечном положении, как в wif «жена». Легко понять изменение звука и в результате чередование жены и жен .Гораздо труднее установить фонематические последствия этого изменения, тем более что английскому языку пришлось ждать до окончания нормандского завоевания a / v / фонемы, заимствованной из французского в таких словах, как , лоза . Обычное объяснение состоит в том, что [v] был аллофоном / f / и позже претерпел структурные изменения, которые переназначили его новой фонеме / v /. Это «структурное изменение» - это безразличное изменение, не имеющее наблюдаемых явлений, чтобы его оправдать, и должно быть установлено исключительно как логическое следствие установления фонематического уровня.Другой хорошо известный случай касается потери / g / после [ŋ] в sing , что, как говорят, имеет эффект повышения [ŋ] до фонематического статуса. В традиционной речи Северо-Западной Англии / g / иногда присутствует, а иногда отсутствует, что означает, что [ŋ] иногда является независимой фонемой, а иногда - аллофоном / n /. Понятие фонемы неполного рабочего дня противоречит, и нет удовлетворительного фонематического объяснения потери / g / в этих диалектах. Неспособность решить проблемы такого рода имела печальные последствия.

В начале 20-го века наблюдался спад интереса к филологии и быстрый рост фонемики со сложными процедурами открытия для установления фонем языка. Историческая случайность заключается в том, что лингвисты, особенно в Америке, пытались дать точное определение фонеме до того, как связь между фонемами и формами волны была адекватно понята. Фонема была определена как характерный речевой звук, и предполагалось, что она играет роль в речи, примерно соответствующую роли букв в письме, в связывании фонетических данных с грамматикой и лексикой, так что фонематическое представление воспринималось как само собой разумеющееся как способ представления слов. в произношении словарей.В то же время фонеме был присвоен ряд свойств без проверки того, что эти свойства логически принадлежат одному и тому же объекту, и в результате фонема стала не единым понятием, а сетью тесно связанных понятий.

Некоторые из этих свойств предполагали простую связь между фонемами и их фонетическими реализациями. Изучение акустической фонетики, в частности разработка звукового спектрографа, показало, что отношения между фонетическими сегментами и фонемами были гораздо более сложными, чем считалось ранее.Например, предполагается, что фонема составляет минимальный заменяемый сегмент речи. Это кажется простым, когда говорящий-человек меняет / t / на / d / в минимальной паре, такой как ten ∼ den , но фонетически это означает изменение относительного времени артикуляционных событий. Символы в транскрипции подразумевают последовательность дискретных звуков, но может быть сложно или невозможно найти единственную точку в форме волны, соответствующую их границам.

Традиционная фонетическая терминология, e.g., «звонкая velar stop» или «закругленная гласная с закругленными углами», распознает частичное сходство между реализациями фонем и подразумевает некую систему признаков, связывающую фонемы друг с другом. Исследования Николая Трубецкого привели к значительному прогрессу в фонологической теории, а именно к выявлению отличительных черт. Нет никакой логической причины, по которой признаки должны быть исключительной собственностью фонем, и они могут быть свойствами слогов, морфем, слов или даже фраз. Также нет никаких причин для того, чтобы функции аккуратно выстраивались на границах фонем, а на практике это не так.Например, назализация носового согласного звука часто ожидается и может продолжаться до следующего сегмента. Время устремления и начала голоса связано с перекрывающимися артикуляциями и не может быть привязано к одному фонематическому сегменту.

С отличительными особенностями связан более широкий вопрос контраста, поскольку фонемы считаются контрастирующими по определению с другими фонемами. Многие фонетические контрасты действительно связаны с фонемами, но в принципе нет причин, по которым они должны быть все вместе.Например, голосовой контраст английского train стока является свойством начала / tr ∼ dr / в целом, и, во всяком случае, голосовых и глухих аллофонов / r /, а не / t ∼ d /. В этом отношении контраст между английскими beat и bit на самом деле не между флисовыми и наборными гласными как таковыми, а между их аллофонами, возникающими до глухих остановок. Контраст становится еще более проблематичным в связанных естественных текстах. Liverpool English имеет контрастность / k ∼ g /, но в текстах, записанных в 1960-х годах, guitar легко можно было принять за catarrh .Более тонкий случай - фраза / li dʊn i /, которая, вероятно, будет интерпретирована как «ну, он сделал это», если она начинается с фарингализации / l /, превращая / l / в «темный» аллофон, но интерпретация » Ли сделал это 'более вероятно, если / l / имеет чистый аллофон. Теперь предполагается, что аллофоны вообще не должны контрастировать, а контраст должен различать фонемы; но здесь различие аллофона приводит к разному толкованию фраз. К началу 1960-х годов стало ясно, что попытка дать единое точное определение фонемы провалилась, и что reductio ad absurdum концепции фонемы оказалось слишком легким делом.

Наряду с теоретической проблемой была практическая проблема организации данных. Структурные лингвисты использовали процедуры открытия, включающие сортировку больших объемов фонетических данных, чтобы установить фонемы языка. Однако эффективная классификация и манипулирование большим количеством объектов либо занимает очень много времени, либо требует базы данных, которая не стала доступной до конца 20 века. В отсутствие реальных баз данных и процедур сортировки базы данных были воображаемыми, а многие процедуры на самом деле были псевдо-процедурами (Abercrombie, 1963), которые на самом деле не выполнялись в реальности, но которые, возможно, когда-нибудь будут выполнены.Доверие к этому подходу во многом зависело от строгого характера процедур открытия, и к началу 1960-х годов они тоже утратили свою способность убеждать.

Как произносится parse | HowToPronounce.com

Анализатор Facebook ™ набрал 500 000 приложений

0 рейтинг рейтинг рейтинги

Разбор использования Skyrockets в Азии

0 рейтинг рейтинг рейтинги

Бывший Джастин.Руководители TV и Parse присоединяются к Y Combinator в качестве партнеров

0 рейтинг рейтинг рейтинги

Джастин Кан и Эммет Шир, основатели Twitch, Тихон Бернстам, основатель Scribd and Parse, Шон Бирнс, основатель Flurry, и Стив Хаффман, соучредитель Reddit и Hipmunk, инвестировали

0 рейтинг рейтинг рейтинги

Обычно пользователям больше не нужно разбирать нечеткий текст.

0 рейтинг рейтинг рейтинги

{{фраза.фраза}}

{{фраза.vote_count}} рейтинги рейтинг рейтинг рейтинги

Грамматика | Британника

Полная статья

Грамматика , правила языка, управляющие звуками, словами, предложениями и другими элементами, а также их комбинацией и интерпретацией.Слово грамматика также означает изучение этих абстрактных функций или книгу, в которой представлены эти правила. В ограниченном смысле этот термин относится только к изучению структуры предложения и слова (синтаксиса и морфологии), исключая словарный запас и произношение.

Далее следует краткое описание грамматики. Полный курс: см. языкознание.

Британская викторина

Тест по грамматике

Какой глагол содержится в предложении «Джон пнул футбольный мяч через двор»? От модификаторов до форм множественного числа - посмотрите, насколько хорошо вы набрали в этом исследовании грамматики английского языка.

Понятия грамматики

Распространенное современное определение грамматики - это основная структура языка, которую любой носитель этого языка знает интуитивно. Систематическое описание особенностей языка также является грамматикой. Это фонология (звук), морфология (система словообразования), синтаксис (образцы расположения слов) и семантика (значение). В зависимости от подхода грамматика, грамматика может быть предписывающей ( i.Например, предоставляют правила для правильного использования), описательные (, т.е. описывают, как фактически используется язык) или генеративные (, т.е. предоставляют инструкции для создания бесконечного числа предложений на языке). Традиционно основное внимание уделялось морфологии и синтаксису, и для некоторых современных лингвистов (и многих традиционных грамматиков) это единственная надлежащая область предмета.

Древние и средневековые грамматики

В Европе греки первыми написали грамматику.Для них грамматика была инструментом, который можно было использовать при изучении греческой литературы; отсюда их внимание к литературному языку. Александрийцы I века до нашей эры продолжили развитие греческой грамматики, чтобы сохранить чистоту языка. Дионис Тракс Александрийский позже написал влиятельный трактат под названием Искусство грамматики, , в котором он проанализировал литературные тексты с точки зрения букв, слогов и восьми частей речи.

Получите подписку Britannica Premium и получите доступ к эксклюзивному контенту.Подпишитесь сейчас

Римляне переняли грамматическую систему греков и применили ее к латыни. За исключением Варрона, жившего в I веке до нашей эры, который считал, что грамматики должны открывать структуры, а не диктовать их, большинство латинских грамматиков не пытались изменить греческую систему, а также стремились защитить свой язык от разложения. В то время как образцом для греков и александрийцев был язык Гомера, труды Цицерона и Вергилия установили латинский стандарт. Работы Доната (4 век нашей эры) и Присциана (6 век нашей эры), наиболее важных латинских грамматиков, широко использовались для обучения латинской грамматике в европейское средневековье.В средневековой Европе обучение велось на латыни, и латинская грамматика стала основой учебной программы по гуманитарным наукам. За это время для студентов было написано много грамматик. Эльфрик, аббат Эйншема (11 век), который написал первую латинскую грамматику на англосаксонском языке, предложил, чтобы эта работа также служила введением в английскую грамматику. Так началась традиция анализа грамматики английского языка по латинскому образцу.

modistae, грамматистов середины 13 - середины 14 веков, которые рассматривали язык как отражение реальности, обращались к философии за объяснением грамматических правил. modistae искал одну «универсальную» грамматику, которая служила бы средством понимания природы бытия. Во Франции 17-го века группа грамматиков из Порт-Рояля также интересовалась идеей универсальной грамматики. Они утверждали, что общие элементы мышления можно различить в грамматических категориях всех языков. В отличие от своих греческих и латинских коллег, грамматики Порт-Рояля не изучали литературный язык, а вместо этого утверждали, что его использование должно диктоваться реальной речью живых языков.Отмечая их акцент на лингвистических универсалиях, современный лингвист Ноам Хомски назвал группу Порт-Ройял первыми трансформирующими грамматиками.

Современные и современные грамматики

К 1700 году были напечатаны грамматики 61 местного языка. Они были написаны в первую очередь с целью реформирования, очищения или стандартизации языка и использовались в педагогических целях. Правила грамматики обычно относились только к формальному, письменному, литературному языку и не применялись ко всем разновидностям реального устного языка.Этот предписывающий подход долгое время доминировал в школах, где изучение грамматики стало ассоциироваться с «синтаксическим анализом» и составлением диаграмм предложений. Оппозиция преподаванию исключительно с точки зрения предписывающих и предписывающих (, т.е. , то есть, что нельзя делать) правил росла в середине десятилетия 20-го века.

Упрощение грамматики для использования в классе резко контрастировало со сложными исследованиями языков, проводимыми лингвистами. В 19 - начале 20 веков историческая точка зрения процветала.Ученые, осознавшие, что каждый живой язык находится в состоянии постоянного изменения, изучили все типы письменных документов современных европейских языков, чтобы определить пути их эволюции. Они не ограничивали свои исследования литературными языками, но также включали диалекты и современные разговорные языки. Исторические грамматики не следовали более ранним предписывающим подходам, а вместо этого были заинтересованы в обнаружении происхождения изучаемого языка.

В результате работы историков-грамматиков ученые пришли к выводу, что изучение языка может быть либо диахроническим (его развитие во времени), либо синхронным (его состояние в определенное время).Швейцарский лингвист Фердинанд де Соссюр и другие описательные лингвисты начали изучать разговорный язык. Они собрали большую выборку предложений, составленных носителями языка, и классифицировали свой материал, начиная с фонологии и заканчивая синтаксисом.

Генеративные или трансформирующие грамматики второй половины 20 века, такие как Ноам Хомски, изучали знания носителей языка, которые позволяют им создавать и понимать бесконечное количество предложений.В то время как дескриптивисты, такие как Соссюр, исследовали образцы индивидуальной речи, чтобы прийти к описанию языка, трансформационисты сначала изучали основную структуру языка. Они попытались описать «правила», которые определяют «компетенцию» носителя языка (бессознательное знание языка) и учитывают все случаи «производительности» говорящего (стратегии, которые человек использует в реальном производстве предложений). См. Порождающую грамматику ; трансформационная грамматика.

Изучение грамматической теории веками интересовало философов, антропологов, психологов и литературных критиков. Сегодня грамматика существует как область лингвистики, но все еще сохраняет связь с другими дисциплинами. Для многих людей грамматика по-прежнему относится к совокупности правил, которые необходимо знать, чтобы говорить или писать «правильно». Тем не менее, с последней четверти 20-го века более сложное понимание грамматических вопросов укоренилось, особенно в школах.В некоторых странах, таких как Австралия и Соединенное Королевство, были разработаны новые учебные программы по английскому языку, в которых грамматика является центром исследования, избегая прескриптивизма прежних времен и используя методы, которые способствуют живому и вдумчивому духу исследования.

Эта статья была недавно отредактирована и обновлена ​​старшим редактором Брайаном Дуиньяном.

Узнайте больше в этих связанных статьях Britannica:

quadrismegistus / prosodic: Prosodic: метрическо-фонологический синтаксический анализатор, написанный на Python.Для английского и финского языков с гибкой языковой поддержкой.

Prosodic - метрико-фонологический синтаксический анализатор, написанный на Python. В настоящее время он может анализировать английский и финский текст, но добавить дополнительные языки легко с помощью словаря произношения или пользовательской функции Python. Prosodic был построен Райаном Хойзером, Джошем Фальком и Арто Анттила, начиная с лета 2010 года. Джош также поддерживает еще один репозиторий, в котором он переписал часть этого проекта, которая выполняет фонетическую транскрипцию для английского и финского языков.Сэм Боуман также внес свой вклад в базу кода, добавив несколько новых метрических ограничений.

О Prosodic

Prosodic выполняет две основные функции. Сначала он токенизирует текст в слова, а затем преобразует каждое слово в ударную, слоговую, фонетическую транскрипцию. Во-вторых, при желании он находит наилучший доступный метрический синтаксический анализ для каждой строки текста. В стиле теории оптимальности предпринимаются (почти) все логически возможные синтаксические анализы, но наилучшими являются те, которые в наименьшей степени нарушают набор определяемых пользователем ограничений.Метрические ограничения по умолчанию предложены Кипарски и Хэнсоном в их статье «Параметрическая теория поэтического метра» (Language, 1996). См. Ниже, как реализованы эти и другие ограничения.

Пример метрического разбора

Вот пример действия метрического синтаксического анализатора в первом сонете Шекспира.

  [текст] [синтаксический анализ]
из самых прекрасных существ, которых мы желаем увеличить с | FAI | rest | CREA | tures | WE | de | SIRE | in | CREASE
что, таким образом, роза красоты может никогда не умереть
но как созревший должен со временем умереть, но | КАК | RI | на | ДОЛЖЕН | на | ВРЕМЯ | де | ПРЕКРАТИТЬ
его нежный наследник может носить его память его | ДЕСЯТЬ | дер | НАСЛЕДНИК | могущество | МЕДВЕДЬ | его | MEM | o | RY
но ты обратился к своим собственным ярким глазам, но | THOU | con | TRACT | ed | TO | thine | OWN | bright |
питай пламя твоего света самодостаточным топливом, питайся своим пламенем СВЕТА.с | SELF | sub | STAN | tial | FU | el
устраивая голод там, где лежит изобилие MAK | ing.a | FA | mine | WHERE | ab | UN | dance | LIES
ты враг твоему сладкому я слишком жесток
Ты, что сейчас являешься свежим украшением мира ты | ЭТО | искусство | ТЕПЕРЬ | МИР | свежий | OR | na | MENT
и только вестник яркой весны и | ON | ly | HER | ald | TO | the | GAU | dy | Spring
в своем собственном бутоне закопайте свое содержимое с помощью | IN | thine | OWN | bud | BU | ri | EST | th | CON | палатка
и нежный churl mak'st отходы в скупости и | TEN | der | CHURL | mak'st | WASTE | in | NIG | gard | ING
пожалей мир, иначе обжора будет милой.| МИР | или | ИНАЧЕ | это | GLUT | тонна | БЫТЬ
съесть причитающееся миру у могилы, и ты, чтобы | ЕСТЬ | | МИРА | должное | ПО | МОГИЛЫ | и | ТЕБЯ
  

Неплохо, правда? Просодика отражает не только общий размер ямба сонета, но и некоторые его вариации. Он точно фиксирует перевороты хореи в линиях « Мак, , , , , где , булочка, танец, , » и « Pi, , мир, или , иначе , это перенасыщение, тонны. быть .«Кроме того, в зависимости от ограничений, он также захватывает удвоенный сильный удар, который часто может следовать за двойным слабым ударом в строке« Твое я твой враг твоему сладкому я тоже жестокий »(см. , для этого метрического паттерна, обзор Брюса Хейса на книгу Дерека Аттриджа The Rhythms of English Poetry на языке Language 60.1, 1984). Здесь также есть некоторые неправильные строки: например, его интерпретация «питать пламя твоего света» . Но насколько он точен в среднем?

Вывод метрических примечаний

См. Здесь для быстрого ознакомления с тремя файлами выходной статистики, созданными в процессе метрической аннотации.

Точность метрического парсера

В предварительных тестах мы запустили Prosodic на выборке из 1800 проанализированных вручную строк ямбического, хореального, анапестического и дактильного стихов (включительно). Например, вот строка и то, как она была проанализирована человеком, Просодик, и «голый шаблон» метра его стихотворения (ямб).

  Линия: Тщетная тревога в поисках дальнего этажа

Человек: ТРЕВОГАЕТСЯ НАЙТИ ДИСТАНЦИОННЫЙ ПОЛ.
            s w w s w s w s w s

Просодич: Тревога в ВОЙНЕ, чтобы НАЙТИ ДИСТАНЦИОННЫЙ ЭТАЖ
            s w w s w s w s w s

Шаблон: AnXIOUS in VAIN, чтобы НАЙТИ ДИСТАНЦИОННЫЙ ЭТАЖ
            w s w s w s w s w s
            * *
  

Мы видим, что Просодич правильно понимает эту строку; в шаблоне все верно, не хватает только хореической инверсии.Пропустив все строки таким образом (используя команду / eval Prosodic [см. Ниже]), мы можем увидеть, какой процент слогов и Prosodic, и шаблон «правильно» захватывают - где «правильно» означает согласие с человеческий разбор.

% Слоги правильно проанализированы
Другой человек Просодик Базовый шаблон (для этого счетчика) Базовый шаблон (ямбический метр)
Ямбические линии 93.7% 92,6% 89,0% 89,0%
Хрохаические линии 98,8% 94,5% 95,3% 4,5%
Анапестические линии 97,2% 84,7% 66,1% 52,9%
Дактильные линии 95,8% 83,8% 75,6% 49,7%

Степень, в которой два человека-метщика (оба англ. Литературы Ph.D. студенты) согласны с тем, что это находится в первом столбце: учитывая, что метрическое сканирование неизбежно варьируется от человека к человеку, это может быть принято как верхний порог того, что мы могли бы ожидать от Просодика. Но Prosodic не так уж и далек, особенно для двоичных измерителей (ямб и хорея). С тройными счетчиками сложнее: они чаще отклоняются от своих метрических шаблонов, как это видно в третьем столбце. Но третий столбец метрических шаблонов предполагает, что мы уже знаем размер стихотворения (что мы и знаем в этом оценочном примере).Неудивительно, что если мы еще не знаем размер и просто применяем темплейт ямба к каждому стихотворению, тогда он хорошо работает для ямбических стихов, но совсем не подходит для стихов других размеров, как можно увидеть в четвертой колонке. Это означает, что для разбора стихов, размер которых неизвестен , или для разбора стихотворений вольного стиха или даже прозы, Prosodic особенно полезен. Разбирая строки индивидуально и независимо от размера «стихотворения», Просодик, тем не менее, способен обнаружить основные контуры метрических узоров в строках.В другом исследовательском проекте, проведенном Стэнфордской литературной лабораторией, синтаксический анализ Просодика позволил предсказать общий размер в 200 стихотворениях с точностью около 98%.

Приведенные выше данные были получены, когда измеритель был определен как следующие ограничения и веса: [* Strength.s => - u / 3.0] [* Strength.w => - p / 3.0] [* stress.s => -u / 2.0] [* stress.w => - p / 2.0] [* footmin-none / 1.0] [* footmin-no-s-except-previous-by-ww / 10.0] [* posthoc-no-final -ww / 2.0] [* posthoc-standardize-weakpos / 1.0] [* word-elision / 1.0] . Эти и другие ограничения упомянуты ниже, но лучше всего задокументированы в их файле конфигурации, config.py .

[И последнее замечание: эти человеческие аннотации сделаны доктором литературных наук. студенты - воплощают определенные предположения о метре, которые распространены в литературных, но не лингвистических кругах. Например, представление хохаической инверсии как буквального переворачивания ступней, «swws», - это не то, как Кипарский представлял бы ее; для него переворот хореи - это просто условное допустимое нарушение ямбического метра.Однако Prosodic не обязательно придерживается одной из этих теорий или подходов: синтаксический анализ, соответствующий любой теории, может быть сгенерирован с использованием различных наборов ограничений.]

Установка

Быстрый старт

Для установки Prosodic лучше всего использовать pip. В терминале введите:

  pip install git + git: //github.com/quadrismegistus/prosodic.git
  

После установки у вас должен быть доступ к исполняемому файлу "prosodic".Просто запустите:

, чтобы открыть интерактивный интерфейс терминала.

Быстрый старт (в Python)

Prosodic также можно использовать в качестве модуля Python в ваших собственных приложениях:

  импорт просодика как p
text = p.Text («Могу я сравнить тебя с летним днем?»)
text.parse ()
  

Инструкции по использованию Prosodic в интерактивном режиме и в качестве модуля Python приведены ниже.

Использование

Существует два основных способа использования Prosodic: в интерактивном режиме и, для более продвинутых пользователей Python, в качестве модуля Python.

Интерактивный режим

Вы можете войти в интерактивный режим просодики, выполнив prosodic . Это приведет вас к такому интерфейсу:

  ###########################################################################
## добро пожаловать в просодик! v1.3 ##
######################################################################


[введите строку текста или введите одну из следующих команд:]
/ text загрузить текст
/ corpus загрузить папку с текстами
/ paste введите многострочный текст

/ eval сравнивает этот измеритель с образцом, помеченным вручную
/ mute скрыть вывод с экрана
/ save сохранить предыдущий вывод в файл
/ выход выход

>> [0.0s] prosodic: en $
  
Загрузка текста

Первое, что нужно сделать при использовании Prosodic, - это дать ему текст для работы. Есть несколько способов сделать это. Самый простой способ - просто набрать строку по одному. Вы также можете ввести / вставить , а затем ввести или скопировать / вставить несколько строк за раз. Вы также можете ввести / text , чтобы загрузить текст, или / corpus , чтобы загрузить папку с текстовыми файлами. Если вы это сделаете, вам будут даны инструкции о том, как указать относительный путь из папки корпуса Prosodic или абсолютный путь к другому файлу или папке на вашем диске.Вы также можете определить текст, с которым хотите работать, в качестве аргумента для команды, которую вы используете для загрузки Prosodic: prosodic /path/to/my/file.txt .

Проверка фонетических / фонологических аннотаций

Еще до метрического анализа загруженного текста (см. Ниже) вы можете запустить несколько команд, чтобы проверить, как Prosodic интерпретировал текст с точки зрения его фонетики и фонологии. Команда / show покажет фонетическую транскрипцию, а также профили ударения и веса для каждого слова:

  000001 из P: ʌv S: U W: L
000002 мужчин P: 'mænz S: P W: H
000003 первый P: 'fɛːst S: P W: H
000004 неповиновение P: `dɪ.sə.'biː.diː.əns S: SUPUU W: LLHHH
000005 и P: ænd S: U W: L
000006 P: ðə S: U W: L
000007 фруктовый P: 'фруктовый S: P W: H
  

Команда / tree показывает иерархическое описание фонологии каждого слова, поскольку оно встроено в иерархическую организацию текста. Например, начало вывода из / tree для этой строки будет:

  ----- | (S1) <Станца>
      |
      | ----- | (S1.L1) <Строка> [первого непослушания человека и его плода]
            |
            | ----- | (S1.L1.W1) <Слово> из <ʌv>
                  | [+ функциональное слово]
                  | [numSyll = 1]
                  |
                  | ----- | (S1.L1.W1.S1) <Слог> [ʌv]
                        | [prom.stress = 0,0]
                        |
                        | ----- | (S1.L1.W1.S1.SB1)  [ʌv]
                              | [shape = VC]
                              | [-prom.vheight]
                              | [-prom.weight]
                              |
                              | ----- | (S1.L1.W1.S1.SB1.O1) <Установка>
                              |
                              | ----- | (S1.L1.W1.S1.SB1.R2) <рим>
                                    |
                                    | ----- | (S1.L1.W1.S1.SB1.R2.N1) <Ядро>
                                          | [-prom.vheight]
                                          |
                                          | ----- | (S1.L1.W1.S1.SB1.R2.N1.P1) <Телефон> [ʌ]
                                    |
                                    | ----- | (S1.L1.W1.S1.SB1.R2.C2) 
                                          |
                                          | ----- | (S1.L1.W1.S1.SB1.R2.C2.P1) <Телефонема> [v]
            |
            | ----- | (S1.L1.W2) <Слово> мужчина <'mænz>
                  | [numSyll = 1]
                  |
                  | ----- | (S1.L1.W2.S1) <Слог> ['mænz]
                        | [prom.stress = 1.0]
                        | [prom.kalevala = 1.0]
                        |
                        | ----- | (S1.L1.W2.S1.SB1)  [mænz]
                              | [shape = CVCC]
                              | [-выпускной вечер.vheight]
                              | [+ выпускной вес]
                              |
                              | ----- | (S1.L1.W2.S1.SB1.O1) <Установка>
                                    |
                                    | ----- | (S1.L1.W2.S1.SB1.O1.P1) <Телефон> [м]
                              |
                              | ----- | (S1.L1.W2.S1.SB1.R2) <рим>
                                    |
                                    | ----- | (S1.L1.W2.S1.SB1.R2.N1) <Ядро>
                                          | [-prom.vheight]
                                          |
                                          | ----- | (S1.L1.W2.S1.SB1.R2.N1.P1) <Телефон> [æ]
                                    |
                                    | ----- | (S1.L1.W2.S1.SB1.R2.C2) 
                                          |
                                          | ----- | (S1.L1.W2.S1.SB1.R2.C2.P1) <Телефон> [n]
                                          |
                                          | ----- | (S1.L1.W2.S1.SB1.R2.C2.P2) <Телефон> [z]
  

Наконец, команда / query позволяет запрашивать эти фонологические аннотации. После ввода / запроса запускается синтаксический анализатор языка запросов (введите / для выхода или нажмите Ctrl + D ). Какие ударные слоги в тексте? (Слог: [+ prom.stress]) . Какие все звонкие фонемы? (Фонема: [+ голос]) . Какие все слоги с звонкими началами и кодами? (Слог: (Начало: [+ voice]) (Coda: [+ voice])) .И т. Д.

Метрический анализ текста

Команда / parse будет метрически анализировать любой текст, загруженный в Prosodic в данный момент. После анализа текста становятся возможными дальнейшие команды, каждая из которых либо просматривает, либо сохраняет данные, полученные от анализатора.

Команда / scan выводит лучший синтаксический анализ для каждой строки, а также статистику того, какие ограничения были нарушены. [Этот вывод, как и любой другой вывод, можно сохранить на диск (а затем открыть в Excel) с помощью команды / save .] Например, вот первые четыре строки Paradise Lost с использованием команды / scan :

  синтаксический анализ текста #pars #viol meter [* footmin-none] [* strong.s => - u] [* strong.w => - p] [* stress.s => - u] [* stress.w => - p]
первого непослушания человека и плод | MANS | first | DI | so | BE | di | ENCE | and.the | FRUIT 3 5 wswswswswws 0 0 2 2 1
этого запретного дерева, чей смертельный вкус | ТО | для | ЗАЯВКИ | den | TREE | которого | MOR | tal | TAST 1 0 wswswswsws 0 0 0 0 0
принесли смерть в мир, и все наши беды принесли | СМЕРТЬ | в | В | МИР | и | ВСЕ | наши | WOE 1 2 wswswswsws 0 0 0 2 0
с потерей рая до одного великого человека с | ПОТЕРЬ | из | ED | en | TILL | one | GRE | ater | MAN 1 2 wswswswsws 0 0 2 0 0
  

Команда / report является более подробной версией команды / scan , печатающей все возможные (т.е.е. негармонически-ограниченный) синтаксический анализ для каждой строки. Например, для каждой строки выводится такой результат:

  ==============================
[строка №1 из 4]: о первом непослушании человека и его плодах

--------------------
[синтаксический анализ № 3 из 3]: ошибки 8.0
1 нед.
2 с МАН
3 нед [* stress.w => - p]
4 с DI
5 нед так
6 с BE
7 Вт ди
8 с ENCE [* stress.s => - u]
9 нед и
10 с [* stress.s => - u]
11 w фрукты [* стресс.w => - p]

[* stress.s => - u]: 4.0 [* stress.w => - p]: 4.0
--------------------

--------------------
[анализ №2 из 3]: ошибки 5.0
1 нед.
2 с МАН
3 нед [* stress.w => - p]
4 с DI
5 нед так
6 с BE
7 w di ence [* footmin-none]
8 с И [* stress.s => - u]
9 нед.
10 с ФРУКТЫ

[* footmin-none]: 1.0 [* stress.s => - u]: 2.0 [* stress.w => - p]: 2.0
--------------------

--------------------
[анализ №1 из 3]: ошибки 5.0
1 нед.
2 с МАН
3 нед [* стресс.w => - p]
4 с DI
5 нед так
6 с BE
7 Вт ди
8 с ENCE [* stress.s => - u]
9 w и [* footmin-none]
10 с ФРУКТЫ

[* footmin-none]: 1.0 [* stress.s => - u]: 2.0 [* stress.w => - p]: 2.0
--------------------

==============================
  

Наконец, вы также можете сохранить различную статистику из метрического синтаксического анализатора в форме, разделенной табуляцией, выполнив команду / stats .

Оценка счетчика по разобранному вручную образцу

Насколько хорошо Prosodic справляется, когда его метрические синтаксические разборы сравниваются с теми, которые аннотировал человеческий читатель? Приведенная выше статистика в разделе «Точность метрического синтаксического анализатора» была сгенерирована с помощью команды оценки: / eval .Оттуда вы можете выбрать электронную таблицу (либо текстовый файл с разделителями табуляции, либо документ Excel), сохраненный в папке tagged_samples / , чтобы использовать ее в качестве «основной истины», синтаксического анализа, аннотированного человеком. Команда / eval спросит, какие столбцы в файле соответствуют строке («Первое неповиновение человека и плод»), синтаксическому анализу («wswswswwsws») и (необязательно) метру строки («ямб» ). Затем Prosodic проанализирует строки под столбцом «строка» (как всегда, используя текущую конфигурацию метрических ограничений в файле config.py ) и сохранять статистику в ту же папку в форме, разделенной табуляцией. Электронная таблица, используемая в приведенной выше таблице точности, предоставлена ​​поэтическим проектом Стэнфордской литературной лаборатории в 2014 и 2016 годах.

Варианты конфигурации

Вся настройка Prosodic происходит в config.py в вашей папке с просодическими данными, которая по умолчанию является папкой prosodic_data в вашей домашней папке. (Если там только config_default.py , скопируйте его в файл config.py .) Этот файл довольно хорошо документирован и является лучшим источником документации о том, как его использовать. (Лучше всего отредактировать этот файл в текстовом редакторе, который выделяет синтаксис Python, чтобы вы могли визуально увидеть, какие настройки деактивированы "закомментированными", то есть наличием символа "#" в начале их строк.) Вот список того, что вы там найдете.

  • Технические параметры работы Prosodic:
    • Пути, используемые для корпусов, результатов и помеченных образцов
    • Используемый язык (в настоящее время английский или финский)
    • Какой механизм преобразования текста в речь, если таковой имеется, используется для анализа неизвестных английских слов?
    • Выводить ли вывод на экран
  • Параметры метрического синтаксического анализа:
    • Минимальный и максимальный размер метрических позиций (от мора до двух и более слогов)
    • Ограничения, используемые в метрическом синтаксическом анализе, некоторые из которых:
      • Ограничения, предложенные Кипарским и Хэнсоном в «Параметрической теории поэтического метра» (язык , , 1996):
        • Сила : Слабый / сильный слог не должен находиться в сильной / слабой метрической позиции.
        • Ударение : Безударный / ударный слог не должен занимать сильную / слабую метрическую позицию.
        • Вес : легкий / тяжелый слог не должен находиться в сильной / слабой метрической позиции.
        • Минимальная ступня : двусложная метрическая позиция не должна содержать больше, чем минимальная ступня (только если слоги являются легкими-тяжелыми или легкие-легкие допустимы двусложные положения).
      • Другие ограничения, регулирующие двусложные метрические позиции
      • Ограничения, позволяющие начальным частям линий быть экстраметрическими
      • Ограничения, регулирующие исключения слов (e.г. «Плутон-и-ан» становится «Плутон-иан»)
    • Что передать метрическому синтаксическому анализатору: строку в текстовом файле, строку между знаками препинания и т. Д.
  • Параметры о словах и токенизации:
    • Регулярное выражение, используемое для токенизации слов
    • Для слов с несколькими профилями напряжения (например, «INto» и «inTO»): разрешить ли метрическому синтаксическому анализатору выбирать профиль напряжения на основе того, что метрически работает лучше всего в строке.
    • Разрешить ли пропускаемое произношение (e.г. "Plu-ton-ian" вместо "Plu-ton-i-an") также в качестве метрических возможностей
    • Как отображать фонетический вывод для слов (IPA, орфография, обозначение CMU)

Опять же, дополнительную информацию см. В документации в файле config.py .

Запуск Prosodic как модуля Python

Prosodic также можно запускать в других приложениях Python.

  В [1]: импорт просодических как p

В [2]: t = p.Text ("corpora / shakespeare / sonnet-001.текст")

В [3]: t.parse ()

В [4]: ​​для синтаксического анализа в t.bestParses ():
   ...: распечатать синтаксический анализ
   ...:
из | FAI | rest | CREA | tures | WE | de | SIRE | in | CREASE
что | ТАМ | авторством | БО | ти | РОЗ | мощь | НЕВ | эр | УМЕРТЬ
[...]
  

Для получения дополнительной информации см. Wiki.

Зависимости

Механизм преобразования текста в речь для анализа неизвестных английских слов

По умолчанию Prosodic использует словарь произношения CMU для определения границ слогов, образца ударения и другой информации об английских словах, необходимой для метрического синтаксического анализа.Строки со словами, которых нет в этом словаре, снова по умолчанию пропускаются при синтаксическом анализе. Однако с помощью механизма преобразования текста в речь можно «озвучивать» неизвестные английские слова в ударной слоговой форме, которая затем может быть проанализирована. Prosodic поддерживает два движка TTS: espeak (рекомендуется) и OpenMary . Я считаю, что espeak дает лучшие слоги, чем OpenMary (по крайней мере, для английского), и его проще использовать, но любой из них будет работать нормально.

Настройка espeak

Espeak - это движок TTS с открытым исходным кодом для систем Windows и Unix (включая Mac OS X).Вы можете скачать его для своей операционной системы здесь. Но если вы используете Mac OS X, еще более простой способ установить espeak - через диспетчер пакетов HomeBrew. Для этого установите homebrew, если вы этого не сделали, а затем запустите в терминале: brew install espeak . После того, как вы установили espeak, установите флаг «en_TTS_ENGINE» в файле config.py на «espeak». Вот и все!

Примечание: Espeak производит un -сложную транскрипцию IPA любого заданного (реального или нереального) слова.Чтобы придать им слоговое выражение, используется слоговик из Penn Phonetics Toolkit (P2TK). Дополнительным плюсом этого конвейера является согласованность: тот же самый слоговый указатель отвечает за границы слогов в словаре произношения CMU, из которого Просодик извлекает (если возможно), прежде чем прибегать к механизму TTS.

Настройка OpenMary

OpenMary - еще один движок TTS с открытым исходным кодом, написанный на Java и разработанный двумя немецкими исследовательскими институтами: лабораторией языковых технологий DFKI и Институтом фонетики Саарландского университета.Чтобы установить OpenMary, сначала загрузите его здесь [выберите ссылку «Run time package»]. Затем разархивируйте zip-файл, перейдите в распакованную папку и запустите OpenMary в качестве сервера. Для этого введите в терминал после распаковки: ./marytts-5.2/bin/marytts-server.sh . Чтобы использовать OpenMary в Prosodic, вам необходимо заранее убедиться, что OpenMary работает как серверный процесс; в противном случае вам придется повторить последнюю команду. Для espeak в этом шаге нет необходимости.

Зависимости модуля Python

По умолчанию Prosodic не имеет зависимостей модулей.Модули, которые он действительно использует - lexconvert, P2TK syllabify.py и Python-переносчик для слоговой орфографии английского языка - небольшие и уже включены в репозиторий. Однако есть несколько исключений, в зависимости от того, что вы хотите сделать. Чтобы установить эти модули, сначала установите pip, если вы еще этого не сделали.

  • Если вы хотите использовать встроенный язык запросов (доступный в «/ query» в интерактивном режиме), вам необходимо установить pyparsing: pip install pyparsing .
  • Если вы используете OpenMary, вам нужно установить синтаксический анализатор XML Beautiful Soup 4 и модуль unicode unidecode: pip install bs4 и pip install unidecode .
  • Если вы хотите иметь возможность читать оценочные данные в виде электронной таблицы (* .xls, * .xlsx) (доступны в «/ eval» в интерактивном режиме), вам необходимо установить xlrd: pip install xlrd .

Как это работает

Как работает просодик? Вот обзор двух его основных аспектов: как слова токенизируются, фонетически транскрибируются, силлабифицируются и ударяются; а затем как эта информация используется для поиска оптимального метрического анализа в соответствии с набором ограничений.

От текста к словам, к фонетике и фонологии

Просодик впервые встречает фрагмент английского или финского текста. Он токенизирует этот текст в соответствии с определяемым пользователем токенизатором, установленным для параметра «tokenizer» в файле config.py , по умолчанию разбивая строки на слова с помощью пробелов и дефисов. В финском тексте представлена ​​реализация финского IPA-транскрипции и слоговой записи на чистом Python, созданная Джошем Фальком. В английском процесс более сложный.Если слово найдено в словаре произношения CMU, используется его слоговая, ударная, фонетическая транскрипция. В противном случае используется механизм преобразования текста в речь, чтобы «озвучить» неизвестное слово, а затем использовать слоговый преобразователь для разбивки ударной транскрипции IPA на слоги. Подробнее об использовании механизма преобразования текста в речь и силлабификатора см. Выше «Механизм преобразования текста в речь для синтаксического анализа неизвестных английских слов».

С помощью этих фонетико-фонологических транскрипций Prosodic строит каждое слово как иерархию его составных частей.Например, английское слово «любовь» интерпретируется:

  | (W1) <Слово> любовь <'l ah v>
| [numSyll = 1]
|
| ----- | (W1.S1) <Слог>
      | [prom.stress = 1.0]
      |
      | ----- | (W1.S1.SB1) 
            | [shape = CVC]
            | [+ выпускной вес]
            |
            | ----- | (W1.S1.SB1.O1) <Установка>
                  |
                  | ----- | (W1.S1.SB1.O1.P1) <Телефон> [l]
            |
            | ----- | (W1.S1.SB1.R2) <рим>
                  |
                  | ----- | (W1.S1.SB1.R2.N1) <Ядро>
                        |
                        | ----- | (W1.S1.SB1.R2.N1.P1) <Телефон> [ʌ]
                  |
                  | ----- | (W1.S1.SB1.R2.C2) <Код>
                        |
                        | ----- | (W1.S1.SB1.R2.C2.P1) <Телефон> [v]
  

Благодаря такой иерархической организации становятся возможными сложные запросы к языковым структурам в их взаимосвязях.Другими словами, поскольку иерархия определяет базовые отношения между лингвистическими структурами «дочерние» или «содержащиеся в», можно запросить, скажем, «все начала с , по крайней мере, с одним звонким согласным в ударных слогах. . " (Подробнее о включенном языке запросов см. Выше).

От фонологии к метрике

Когда эти фонетические и фонологические аннотации к словам размещены, метрический синтаксический анализ может затем использовать их, поскольку он пытается максимизировать соответствие между метрически сильными позициями и, скажем, слоговым ударением.Синтаксический анализ выполняется в духе теории оптимальности: (почти) предпринимаются попытки (почти) всех логически возможных синтаксических анализов, но наилучшими являются те, которые в наименьшей степени нарушают набор определяемых пользователем ограничений. Если общая оценка нарушения синтаксического анализа A для каждого ограничения такая же, как и оценка синтаксического анализа B, но есть хотя бы одно ограничение, при котором оценка нарушения синтаксического анализа A даже хуже, чем оценка нарушения синтаксического анализа B, то синтаксический анализ A "гармонически ограничен" синтаксическим анализом B. A никогда не бывает лучше Parse B; и по крайней мере в одном случае это хуже.Независимо от того, как взвешиваются ограничения, эти «ограниченные» синтаксические разборы категорически хуже других. Метрический синтаксический анализатор, написанный в основном Джошем Фальком, работает так же быстро, как и он, игнорируя гармонически ограниченные синтаксические разборы по мере его продвижения: таким образом, ему не нужно продвигаться дальше по синтаксическому анализу, как только он понимает, что этот синтаксический анализ уже ограничен другие разборы.

Количество неограниченных синтаксических разборов для данной строки, таким образом, представляет некоторую метрическую сложность строки.Например, возьмем фразу Ричарда III (Шекспира): «Лошадь! Лошадь! Мое ​​королевство вместо лошади!» Только один синтаксический анализ выживает в процессе гармонического ограничения:

  [анализ № 1 из 1]: ошибки 2.0
1 нед.
2 с ЛОШАДЬ
3 нед
4 с ЛОШАДЬ
5 нед.
6 с КОРОЛЬ
7 Вт дом
8 с ДЛЯ [* stress.s => - u]
9 нед
10 сек ЛОШАДЬ

[* stress.s => - u]: 2.0
  

Этот синтаксический анализ нарушает только одно ограничение: он возвышает безударное слово «for» до метрически сильной позиции.Сравните эту строчку с другой строкой Шекспира, которая имеет такое же количество слогов, но более сложна в метрическом отношении: «Никогда еще яд не исходил из такого сладкого места». Здесь выживают четыре синтаксических анализа:

  --------------------
[синтаксический анализ №4 из 4]: 14.0 ошибок
1 w nev [* Strength.w => - p] [* stress.w => - p]
2 с ER [* Strength.s => - u] [* stress.s => - u]
Пришло 3 недели [* stress.w => - p]
4 секунды POI
5 Вт сын
6 с ОТ [* stress.s => - u]
7 нед так
8 сек СЛАДКИЙ
9 нед
10 с МЕСТО

[*сила.s => - u]: 3.0 [* Strength.w => - p]: 3.0 [* stress.s => - u]: 4.0 [* stress.w => - p]: 4.0
--------------------

--------------------
[синтаксический анализ № 3 из 4]: 13.0 ошибок
1 с NEV
2 недели
3 с ПРИШЕЛ POI [* footmin-none] [* footmin-no-s-except -preded-by-ww]
4 w сын
5 с ОТ [* stress.s => - u]
6 нед так
7 сек СЛАДКИЙ
8 нед
9 с МЕСТО

[* footmin-no-s-except-previous-by-ww]: 10.0 [* footmin-none]: 1.0 [* stress.s => - u]: 2.0
--------------------

--------------------
[анализ №2 из 4]: 9.0 ошибок
1 с NEV
2 пришли [* stress.w => - p] [* footmin-none]
3 секунды POI
4 w сын от [* footmin-none]
5 с SO [* stress.s => - u]
6 w sweet a [* stress.w => - p] [* footmin-none]
7 с МЕСТО

[* footmin-none]: 3.0 [* stress.s => - u]: 2.0 [* stress.w => - p]: 4.0
--------------------

--------------------
[синтаксический анализ № 1 из 4]: ошибки 6.0
1 с NEV
2 пришли [* stress.w => - p] [* footmin-none]
3 секунды POI
4 w сын
5 с ОТ [* stress.s => - u]
6 нед так
7 сек СЛАДКИЙ
8 нед
9 сек МЕСТО [* posthoc-standardize-weakpos]

[* footmin-none]: 1.0 [* posthoc-standardize-weakpos]: 1.0 [* stress.s => - u]: 2.0 [* stress.w => - p]: 2.0
--------------------
  

Лучший синтаксический анализ (внизу) - ямб с хоровой инверсией; оно нарушает ограничение на понижение ударных слогов («пришел») в метрически слабую позицию, а также ограничение, препятствующее двусложным позициям. Следующая лучшая - это дактильная интерпретация линии, но она также нарушает определенные ограничения. Третий лучший попытался втиснуть два слога в сильную позицию, а последний - традиционный ямбический синтаксический анализ - попытался изменить контур ударения слова «никогда», что нарушает ограничения, поощряющие соответствие между метром и «силой» слога в многосложных словах. .

Метрические ограничения по умолчанию предложены Кипарски и Хэнсоном в их статье «Параметрическая теория поэтического метра» (Language, 1996). См. config.py для лучшего описания этих и других ограничений.

Расширение Prosodic

Добавление языков

Есть два возможных метода, с помощью которых Просодик может понимать язык:

  • с использованием словаря в формате:

    • {слово-токен} [табуляция] {ударение, слоговое письмо, формат IPA}
    • например:
      • сбивать с толку [tab] bɪ.'fə.dəl
      • befuddled [tab] bɪ.'fə.dəld
      • сбивает с толку [вкладка] bɪ.'fə.dəlz
  • с использованием функции python, которая принимает слово-токен в качестве входных данных и ударный, слоговый формат IPA в качестве выходных данных.

В настоящее время финский язык используется вторым методом; Английский, комбинация двух, с использованием словаря для распознанных слов и функции Python для нераспознанных слов.

Чтобы добавить статьи в словарь языка, просто добавьте запись в указанном выше формате в словарь [имя_языка].tsv в папке [prosodic_dir] / dicts / [language_twoletter_code] .

Чтобы полностью добавить новый язык, вы можете создать новый словарь в указанном выше формате и поместить его в папку [prosodic_dir] / dicts / [language_twoletter_code] / [language_name] .tsv . Или вы можете создать файл python под [prosodic_dir] / dicts / [language_twoletter_code] / [language_name] .py , который имеет функцию get (token, config = {}) . Эта функция должна принимать слово-токен в качестве своего единственного аргумента и параметры конфигурации Просодика в качестве необязательного аргумента ключевого слова, и она должна возвращать список кортежей в форме:

  [
(
<строка Unicode ipa>,
<строка токена разделена на список строк слогов>,
{словарь необязательных аргументов ключевого слова для хранения в объекте слова},
),
...
]
  

Например, get ("into", config = {'add_elided_pronunciations': 1}) может вернуть:

  [
(u "ɪn.'tuː", ['in', 'to'], {'is_elision': False}),
u "'ɪn.tuː", [' in ',' to '], {' is_elision ': False}),
u "ɪn.tʌ", ['in', 'to'], {'is_elision': False})
]
  

См. Для примера функцию get () в dicts / en / english.py или dicts / fi / finnish.py .

Внесение вклада в кодовую базу

Пожалуйста, загрузите и вернитесь к базе кода здесь! И не стесняйтесь использовать этот код в своих проектах: он под лицензией GPLv3.

Форум | Лингвистика

Фонетический и фонетический форум Беркли ("Phorum") - это еженедельная серия лекций и дискуссий, включающая презентации по всем аспектам фонологии и фонетики.

Мы встречаемся в пятницу с 15:00 до 16:00 на Zoom. Пожалуйста, напишите одному из организаторов ссылку для увеличения или попросите добавить вас в список рассылки (который будет включать соответствующие ссылки).

Phorum организован Дакотой Робинсон и Анной Бьёрклунд. Наши электронные письма - соответственно "dakota_robinson" и "aebjorklund" @berkeley.edu.


Весна 2021 - Предстоящие переговоры

5 февраля

Максимилиан Дабковски (Калифорнийский университет в Беркли): стресс в парагвайском гуарани

Я описываю и анализирую распределение стресса в парагвайском гуарани (Tupian, ISO 639-3: gug). В PG финальное ударение преобладает как на уровне просодических слов, так и на уровне фонологических фраз. Однако незавершенное ударение также подтверждается исключительными корнями, морфологически сложными словами и фонологическими фразами, состоящими из нескольких слов. Я предполагаю, что существует один основной механизм назначения стресса в PG: в ходе просодификации стресс нацелен на правый край просодической составляющей.Это фиксирует преимущественно заключительный стресс PG. Наконец, я предполагаю, что незавершенное ударение является следствием экстраметричности, экстрапрозодического суффикса и избегания столкновений напряжений, которые правильно ограничивают отклонения от окончательности ударения, наблюдаемые в парагвайском гуарани.

12 февраля

Флориан Лайоннет (Принстонский университет): Даунстеп в Пайси: между акцентом и тоном

В этом выступлении я предлагаю описание и анализ тона в пайси, языке Новой Каледонии и одном из редких языков Океании, где была разработана система тонов без внешнего влияния.Основываясь на работе Жан-Клода Ривьера (1974, 1978) и опираясь на данные полевых исследований, я показываю, что тональная система Paicî лучше всего описывается с помощью трех основных примитивов: двух тонов (высокий против низкого) и нисходящего / ꜜ /. Даунстеп Пайси особенно интересен с точки зрения эмпирической документации, а также типологического и теоретического понимания даунстепа, потому что он сочетает в себе множество редких свойств, в том числе следующие:

(i) он влияет только на L тонов и засвидетельствован только после L-тона или произнесения первоначально;

(ii) это собственный фонологический объект, регистровый признак, отдельный от тона и только косвенно взаимодействующий с ним;

(iii) он не запускается плавающим звуковым сигналом;

(iv) это «всего» в терминах Меессена (1970: 270), i.е. он понижает регистр таким образом, чтобы новый «потолок» соответствовал прежнему «полу»;

(v) он является кульминационным и демаркационным в просодическом слове и частично обусловлен метрической структурой.

Многие из этих свойств обладают ярко выраженным акцентным ароматом. Таким образом, просодическая система Пайчи, по-видимому, состоит из двух подсистем: однозначной тональной системы (с лексическим контрастом H и L), без акцентных свойств (следовательно, без «высотного акцента») - и параллельной системы, которую лучше всего описать как дефектная акцентная система на ранних этапах тонологизации, отмеченная дауншагом.Предварительные сравнительные данные из соседних и тесно связанных (нетональных) Xârâc показывают, что паттерн даунстепа Paicî действительно очень вероятно является тонологизированным потомком бывшей акцентной системы, которая исторически предшествовала нововведению тональных контрастов в Paicî.

19 февраля

Ханна Сэнде (Калифорнийский университет в Беркли)

Регистрационная встреча, организованная Ханной Санде: приходите, чтобы поделиться текущими и предстоящими проектами и познакомиться с нашим новым преподавателем!

26 февраля

Сюзанна Леви (Нью-Йоркский университет): Знакомство с говорящим помогает восприятию речи.На этом заканчивается польза?

Чтобы понять речь, слушатели должны анализировать сильно изменчивый акустический сигнал на соответствующие фонологические категории, специфичные для языка, и обобщать эти категории на новые стимулы, чтобы правильно воспринимать слова. Предыдущие исследования показали, что слушатели лучше обрабатывают речь знакомых ораторов, обычно измеряемую в устном слове или задаче распознавания предложения. Работа в лаборатории распространила эти выводы на детей с различными языковыми навыками.На следующем этапе нашего исследования мы проверим, влияют ли преимущества на уровне восприятия речи на обработку более высокого уровня.

5 марта

Кэти Рассел (Калифорнийский университет в Беркли): грамматический тон и длина в Gã

In Gã [Kwa; Гана] тонально выражены многие различия между напряжением, аспектом, настроением и полярностью (ТАМП). Когда подлежащее в предложении является местоименным, эти грамматические тона реализуются на префиксе местоимения подлежащего: с предметами без местоимения они выражаются вместо глагольных префиксов TAMP.Предыдущая литература сосредоточена вокруг двух основных анализов для объяснения этих изменений. Кропп Дакубу (2002) описывает процессы как результат удаления префикса TAMP после местоимения, в котором тон местоимения разъединяется и повторно ассоциируется с местоимением. Пастер (2003), с другой стороны, утверждает, что процесс удаления префикса после местоимений не является частью синхронной фонологии, вместо этого аргументируя необходимость анализа местоимений, анализируются как морфы Portmanteau STAMP (субъект TAMP).В этом выступлении я представляю новые данные, собранные с носителем языка Gã, которые проливают свет на эти процессы, в частности, на примерах, включающих промежуточные составляющие PP, которые ранее не обсуждались в связи с грамматическим тоном в Gã. Я утверждаю, что эти данные свидетельствуют о том, что анализ портфеля, предложенный Пастером, применим не для всех контекстов. Вместо этого я придерживаюсь мнения, что префиксы местоимений подлежащего сливаются с префиксами аспектов и настроения. Кроме того, я представляю новые данные, связывающие прогрессивную маркировку, которая увеличивается надсегментно через длину гласного, с грамматическим тоном.

12 марта

Анна Май (UCSD): О взаимосвязи между взаимодействием и сложностью в фонологии

В этом докладе я представлю совместную работу с Эриком Мейнхардтом, Эриком Баковичем и Адамом МакКоллумом над классами регулярных функций на внешнем крае сложности, ожидаемой для фонологических паттернов. В частности, я сосредоточусь на классе слабо детерминированных функций, классе регулярных функций, ранее предполагавшихся, что они представляют верхнюю границу фонологической сложности.Основываясь на демонстрации Elgot & Mezei (1965), что регулярные функции могут быть разложены на две противоположные подпоследовательные функции, я представлю определение слабо детерминированных функций как тех, для которых два противоположных подпоследовательных составных песка не взаимодействуют таким образом, чтобы быть формально уточненным. При этом данная работа устанавливает связи с более знакомыми понятиями взаимодействия в фонологической литературе и дает более глубокое понимание того, что отличает фонологические паттерны, требующие наибольшей выразительности регулярных функций (т.е., недетерминизм) от тех, которые требуют должным образом субрегулярной выразительности (то есть слабого детерминизма).

2 апреля

Кари Гарвин (Калифорнийский университет в Беркли): слоговая, стрессовая и жестовая диагностика на английском языке

Фонологическая теория делает сильные прогнозы относительно силлабификации в английском языке, где фонологические модели обычно делают слоговую последовательность VCCV как V.CCV, пока кластер является допустимым началом. Это подтверждается типологическими данными, которые предполагают, что коды более выражены, чем начала.Модели жестовой координации, такие как модель связанного осциллятора, аналогичным образом подтверждают принцип максимизации начала, утверждая, что начала синхронно планируются со следующей гласной, глобальная синхронизация , тогда как коды синхронизируются последовательно, локальная синхронизация ; в результате ядра начала + более стабильны, чем коды. В то время как литература по координации жестов продемонстрировала этот паттерн координации начальных слов в английском языке, исследования были сосредоточены на начальных словах и ударных слогах, и, таким образом, еще предстоит определить, распространяются ли эти паттерны координации на средние и безударные слоги.Более того, фонологические модели предсказывают, что медиальные последовательности слов должны следовать слоговой схеме границы слова; однако типологически общие фонологические паттерны, такие как лениция, и паттерны распределения, такие как краевые эффекты и экстраметричность, предполагают, что поля среднего слога слова отличаются от полей слога границы слова. В этой презентации я представлю данные электромагнитной артикулографии (EMA), чтобы проиллюстрировать влияние ударения и положения слова на артикуляцию и силлабификацию в английском языке, чтобы показать, что наши текущие фонологические и жестовые модели недостаточны для прогнозирования и моделирования средней силлабификации слов.Вместо этого я предлагаю, чтобы согласование колебаний челюсти с сегментными последовательностями служило диагностикой для силлабификации, которая может быть использована как в жестовых, так и в фонологических моделях, чтобы лучше улавливать подтвержденные образцы структуры слога в кросс-лингвистическом плане.

9 апреля

Махо Моримото (Национальный институт японского языка и лингвистики [НИНДЖАЛ])

Хотя известно, что класс жидкостей особенно сложно охарактеризовать фонетически (например,г. Lindau 1985), недавние инструментальные исследования предполагают, что венечные жидкие согласные характерно сложны в жестах, требуя координации венечных и спинных жестов (Proctor 2011, Sproat and Fujimura 1993, Delattre and Freeman 1968). В этом выступлении я исследую эту гипотезу с точки зрения японского жидкого согласного / r /, часто описываемого как апико-альвеолярный щелчок или лоскут. Сначала я представляю артикуляционные и акустические результаты производственного эксперимента с использованием EMA (электромагнитной артикулографии), которые предполагают (хотя и неудовлетворительно), что существует возможность втягивания языка в дополнение к апикальному жесту.Далее я исследую эту гипотезу с помощью акустических данных из речевого корпуса.

16 апреля

Наташа Уорнер (Университет Аризоны): Восприятие всех английских звуковых последовательностей: роли вероятности и продолжительности (в сотрудничестве с Сонджин Парк)

Как слушатели воспринимают звук по мере того, как акустическая информация в речевом сигнале распространяется с течением времени? Большинство экспериментов по восприятию речи исследуют восприятие определенных типов звуковых последовательностей, чтобы ответить на конкретный вопрос.Мы сообщаем об очень большом исследовании восприятия всех возможных двухзвучных последовательностей английского языка с течением времени по мере того, как речевой сигнал становится доступным слушателю. Это исследование позволяет нам сравнить, как вся речь воспринимается на языке, при этом данные сопоставимы для всех типов звуковых переходов (например, CC, CV, VC и VV). Эти данные могут использоваться для ответа на вопросы о фонетике восприятия речи, а также в качестве входных данных для моделей распознавания устных слов.

В текущем докладе мы исследуем роли двух факторов, помимо основных акустических сигналов различных типов сегментов: вероятность появления сегментов и то, как долго сохраняется акустическая информация (продолжительность).Когда у слушателей еще недостаточно акустических сигналов для восприятия сегмента, используют ли они лексическую вероятность, чтобы попытаться предсказать звуки? Мы обнаружили, что, хотя может показаться, что они используют вероятность, на самом деле это отражает использование категориальных фонологических паттернов, а не градиентное использование вероятности, по крайней мере, в этой задаче низкого уровня. Что касается продолжительности, можно задаться вопросом, становятся ли звуки акустически более четкими, если они продолжаются дольше, предоставляя слушателю больше шансов услышать акустические сигналы.Однако прошлые исследования могут предположить, что перцептивная информация обеспечивается не добавленной продолжительностью, а быстрым акустическим изменением. Наши результаты показывают, что большая продолжительность полезна только тогда, когда она совпадает с периодами внезапной новой акустической информации, а не более длительная продолжительность полезна сама по себе. В целом, эти результаты предполагают сильную роль акустических сигналов низкого уровня и роль фонологии в восприятии речи

30 апреля

Юни Ким (Университет Эссекса): Фонологически обусловленная алломорфия флективного тона Амузго

В Амузго (Ото-Мангеан; Мексика) тональные чередования способствуют маркировке лица / числа.Несмотря на то, что существует большое количество лексически произвольных классов тональной флексии (Kim 2016, Palancar 2020), в определенных грамматических контекстах флективные тона становятся предсказуемыми на основе лежащего в основе лексического тона и наличия / отсутствия конечной голосовой остановки на основе глагола (как кратко упоминается в Sande 2019 и Kim & Sande 2020). Это случай фонологически обусловленной алломорфии, поскольку никакая правдоподобная фонологическая операция не может связать лексические тоны с флективными. Тем не менее, этот паттерн нелегко сочетается со стандартными подходами к фонологически обусловленной алломорфии, такими как подкатегоризация или оптимизация фонологического вывода на основе маркировки.Скорее, я анализирую паттерн как вовлекающий взаимодействие точности ввода-вывода с произвольными (но независимо мотивированными) морфотаксическими ограничениями. Я заметил, что, хотя верность обычно не участвует в отборе алломорфа, тон более склонен к замещающей морфологии, чем другие типы экспонентов, открывая дверь в верность как механизм. Более того, паттерн Amuzgo поддерживает подход, основанный на кофонологии, поскольку решающее взаимодействие между верностью и морфотактикой не может быть достигнуто с помощью конкатенации и чередования (шаг e.г. Bye & Svenonius 2012). Я пришел к выводу, что тон очень особенный (Hyman 2011, среди прочего).

Осень 2020 - Архив переговоров

4 сентября

Круговая система

Студентам и преподавателям предлагается обсудить свои прошлые и предстоящие исследования.

11 сентября

Николас Ролле (Leibniz-Zentrum Allgemeine Sprachwissenschaft (ZAS)) - Первая и последняя гармония или внешняя алломорфия в грамматическом тоне чилунгу

Мы представляем тематическое исследование грамматической алломорфии тонов в Чилунгу (банту).Обозначения времени / аспекта / настроения (TAM) реализуются через совместное экспонирование префиксов, суффиксов и плавающих тонов. В небольшом количестве ТАМ (например, Recent Past / á-cí-… -il-e /) есть алломорфия с плавающими тонами. При использовании «Recent Past» один - это высокий тон, нацеленный на последний TBU ствола ( F ) на правом краю, по сравнению с одним, нацеленный на второй TBU ствола ( 2 ). Для всех TAM чередование обусловлено тоном маркеров предметного согласия (SM) у левого края слова.Если SM с высоким тоном, встречается вариант Ⓗ F , но если он не тоновый, то возникает 2 .

Мы представляем два конкурирующих счета этих данных. В рамках морфологического описания мы постулируем контекстные реализационные правила с несколькими хранимыми алломорфами, то есть различными (дополнительными) показателями, обусловленными тоном SM. Напротив, под фонологическим счетом существует морфологически обусловленная фонология, вызывающая чередование, срабатывающее только в контексте SM и небольшого набора TAM.Правило зафиксировало бы заговор в этих чередованиях: если SM - это H на левом краю, то есть грамматическая H на правом краю, но если левый SM не имеет тона, то грамматический тон не падает на правый край ( правило «согласия первого / последнего тона»). Мы приводим несколько аргументов в пользу морфологического анализа (дополнения) по сравнению с фонологическим (морфологически обусловленная фонология) и обсуждаем главный теоретический вывод: внешняя фонологически обусловленная алломорфия возможна, стандартно утверждается, что она не подтверждена и / или невозможна. .

[В сотрудничестве с Ли Бикмором - Университет Олбани]

18 сентября

Марта Шварц (Калифорнийский университет в Беркли)

25 сентября

Хоссеп Долатиан (Университет Стоуни-Брук) - Парадоксы брекетинга на основе головы в армянских соединениях

Часто утверждают, что слова имеют сложную внутреннюю структуру с точки зрения их морфологии, фонологии и семантики. На первый взгляд, армянские соединения представляют собой парадокс, заключающий в скобки их морфологическую и фонологическую структуру.Я утверждаю, что этот парадокс заключения в скобки одновременно указывает на эндоцентричность, страты и просодию. Я использую армянский язык в качестве примера, чтобы аргументировать использование циклических подходов к заключению в скобки парадоксов по сравнению с более распространенными контрциклическими подходами. Я анализирую парадокс брекетинга с помощью циклических операций над головой (Hoeksema, 1984) и просодической фонологии (Nespor, Vogel, 1986), в частности, Prosodic Stem (Downing 1999a). Я утверждаю, что взаимодействие между парадоксом, заключенным в скобки, и остальной частью составной фонологии требует использования слоевых уровней и цикличности.Я утверждаю, что контрциклические подходы, такие как «Морфологическое слияние» (Marantz, 1988) или «Морфологический ребрекетинг» (Sproat, 1985), неадекватны, поскольку они делают неверные прогнозы относительно армянской фонологии.

9 октября

Коннор Майер (Калифорнийский университет в Лос-Анджелесе) - Градиент непрозрачности в уйгурской гармонии спинки.

Непрозрачность долгое время была важной проблемой для фонологической теории, особенно при оценке последовательных теорий, таких как SPE, в сравнении с параллельными теориями, такими как OT. В этой презентации будет рассмотрен случай непрозрачности на уйгурском (тюркский: Китай).В дополнение к демонстрации обратности и гармонии округления, у уйгурского есть процесс сокращения гласных, который нейтрализует гласные переднего и заднего ряда / æ / и / ɑ / до гармонически нейтрального гласного / i /, потенциально вводя непрозрачность в систему гармонии. Основываясь на комбинации извлечения и крупномасштабного исследования корпуса, я показываю, что непрозрачная гармония (гармония с лежащими в основе формами, даже когда она производит поверхностную дисгармонию) является стандартным паттерном в уйгурском языке. Однако отдельные стебли могут также появляться в жетонах с гармонией на поверхности.Анализ частот корпуса показывает, что слова, непроявленные формы которых встречаются чаще, и которые в целом встречаются с большей частотой в целом, с большей вероятностью будут отображать непрозрачную гармонию. Я моделирую эти данные, используя вариант ограничений единообразия парадигмы, который, вместо того, чтобы требовать, чтобы свойства основы были инвариантными для всех алломорфов, требовали, чтобы все алломорфы основы принимали суффиксы, которые гармонируют с их базовой формой, даже если это нарушает гармонию поверхности. Сила конкретного алломорфа как основы зависит от того, как часто он встречается.Я заканчиваю обсуждением значения этих результатов для теорий представления и изучения непрозрачных паттернов.

23 октября

Джульет Стэнтон (Нью-Йоркский университет) - Выбор алломорфа предшествует фонологии: данные из Йинджибарнди

Теории интерфейса фонологии и морфологии различаются в своих утверждениях относительно времени фонологически обусловленной дополнительной алломорфии (PCSA) и регулярной фонологии. Некоторые (например, Paster 2006, Wolf 2008) утверждают, что PCSA может или должен предшествовать фонологии; другие (e.г. Mascaró 2007, Smith 2015) утверждают, что хотя бы фонологическая оптимизация PCSA работает параллельно с фонологией. В этой статье обсуждается случай частичной оптимизации PCSA в Yindjibarndi (Pama-Nyungan, Wordick 1982), показано, что анализ невозможен в предположении, что PCSA и фонология происходят параллельно, и предлагается анализ, согласно которому дополнение предшествует фонологии.

6 ноября

Ана Ливия Агостиньо (Калифорнийский университет в Беркли) - Словесная просодия в легком: одна система или две?

В этом докладе мы представляем фонологический анализ слово-просодической системы Lung'Ie (код ISO 639-3: PRE), креольского языка, основанного на португальском языке, на котором говорят в Сан-Томе и Принсипи.Lung'Ie произвел уникальный результат контакта двух различных просодических систем, общих для креолизации: лексификатора ударения с акцентом (португальский) и субстратов языка тонов. В языке есть ограничительная привативная система тонов H / Ø, в которой H является кульминационным, но необязательным (есть слова без тона). Поскольку возрастающие CVV ́ и спадающие CV ́V тоны контрастны и синхронно непредсказуемы на долгих гласных, тон должен быть отмечен нижестоящим. Хотя ясно, что необходимы тональные обозначения, Lung'Ie раскрывает два свойства, более ожидаемых от акцентной системы: (i) в слове может быть только один тяжелый слог (CVV, CVC, CVG); (ii) этот слог должен иметь тон Н.Это поднимает вопрос о том, имеют ли слоги с кульминационной буквой H метрическую значимость, то есть ударение. Однако проблема с отождествлением ударения с тоном H заключается в том, что в Lung'Ie есть два вида существительных: существительные с кульминативным падежом H и бесцветные (все-Ø). Существительные с кульминацией H на 87% имеют португальское происхождение, включенное в результате выравнивания ударения по тону, в то время как бестональные на 93% имеют африканское происхождение. Хотя сообщалось о других креольских языках с разделенными системами «акцентированный» vs.полностью определенные тональные лексемы и другие со смешанными системами тона и ударения, Lung'Ie отличается от этих случаев тем, что трактует слова африканского происхождения как бесцветные, что является довольно неожиданным результатом. Мы отвечаем на различные прошлые описания словесной просодии Lung'Ie (Agostinho 2015, 2016; Günther 1973; Maurer 2009; Traill and Ferraz 1981) и оцениваем две возможные интерпретации данных Lung'Ie. ограничительная тональная система с кульминационным / H / и необычным требованием «веса к тону».Во-вторых, Lung'Ie имеет «раздельную» просодическую систему, в которой слова либо имеют ударение и тон с более обычным требованием «веса к ударению», либо одновременно не имеют тона и стресса.

13 ноября

Шанталь Граттон (Стэнфордский университет)

4 декабря

Марта Шварц (Калифорнийский университет в Беркли) - Влияние аспирации кода на продолжительность предшествующей гласной в непальском языке

Многие кросс-лингвистические данные показывают, что гласные длиннее звонких согласных, чем глухие, но меньше исследований изучают корреляцию между другими характеристиками гортани и длительностью гласных, и результаты этих исследований противоречивы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *