Что поисковым машинам помеха, а изучающим язык - минимальный словарный запас.

Полагаю, что каждый, кто начинал учить язык, так или иначе сталкивался с такой мыслью: “Язык - это набор слов! Нужно просто побыстрее выучить слова, если не все, то - как можно больше. Надо только найти подходящий способ.”
Помню, как на основании такого подхода я пытался решить проблему с английским: открывал небольшой школьный словарик на 2 тысячи слов и, начиная с первой страницы, пытался их вызубрить. Делал карточки, носил с собой, клеил по квартире, пробовал использовать разные техники, вплоть до изучения слов во сне. В лучшем случае, моего терпения хватало на 30-50 слов.
Позже, в университете, интересуясь проблематикой запоминания, я узнал о двух исследованиях, которые натолкнули меня на ряд мыслей. Одно исследование было проведено немецким психологом Германом Эббингаузом (аж в 1885 году) и привело его к понятию “Кривой забывания” и нескольким принципам.
Один из которых меня заинтересовал больше других: “Осмысленное запоминание в 9 раз быстрее механического заучивания.” Забавно, что современные системы изучения слов часто идут по пути их механического заучивания, предлагая вспоминать слова через определенные промежутки времени. Выдавая за современные психологические достижения, они используют временные закономерности запоминания, открытые еще около 127 лет назад.
Другое исследование было проведено американским психологом Джоржем Миллером в середине ХХ века, в 1956 году, и привело его к открытию магического числа - 7+-2. Его эксперименты в дальнейшем так же были многократно повторены и подтверждены. И чаще всего это происходило и происходит на практических семинарах по экспериментальной психологии.
Помню, как на одном из таких занятий в попытках не отстать в показателях оперативной памяти набрел на принцип группировки. Мы давали друг другу списки несвязанных слогов, чисел, слов. После нескольких пар экспериментов выяснилось, что я запоминаю в два раза меньше “несвязанной” информации, чем моя напарница, около 5 - 6 единиц. Это задевало, и поскольку инструкция не запрещала, я решил покончить с простым механическим запоминанием и начал в своем воображении группировать слова в некие единые образы. Это сразу позволило запоминать 25 - 30 и более слов. Но на самом деле несвязанной информации я запоминал все равно около 5 единиц.
Данные эксперименты, какими бы банальными они не выглядели, в итоге натолкнули меня на следующее:
- Ограничения, увы, мизерной оперативной памяти человека, заставляют задуматься над довольно жестким отбором того, что требуется просто запомнить. Это можно сравнить с отбором вещей для длительного пешего похода, когда приходится брать с собой только действительно крайне необходимое.
- Осмысленность на порядок снижает затраты на усвоение материала.
- То, что требуется запомнить, стоит связывать в некоторые большие образы или структуры, для уменьшения общего количества единиц информации.
- Привязка нового материала, “якорение” к своему персональному опыту максимально упрощает процесс запоминания.
- Регулярность использования нового материала может быть решающим фактором.
Конечно есть громадное количество всяких психотехник и тренировок памяти обещающих запоминание до 100 незнакомых слов в час, но я не буду их тут обсуждать, как не собираюсь критиковать сам подход к изучению языка через заучивание отдельных слов. Но, учитывая первый пункт, хочу поделиться несколькими мыслями о самом минимальном списке слов, которые имеет смысл учить в первую очередь. Сколько подходов, сколько учителей - столько и списков. Я предлагаю взглянуть на эту проблему с двух точек зрения. Одна - это методика Милашевича. Вторая - взгляд на язык с точки зрения NLP, обработки естественного языка (Natural Language Processing).
Метод Владислава Милашевича.
Перед тем как научить людей читать научно-технические тексты в интенсивном курсе за 5 дней (40 часов), Владислав Витольдович Милашевич требовал знания словарного минимума. (его фамилию часто пишут с ошибкой, в интернете можно встретить такое сочетание - “метод Милошевича”)
В него входят числительные, артикли, местоимения, предлоги и союзы, служебные глаголы и их формы, некоторые наречия, часто встречающиеся глаголы ... - всего порядка 220 - 230 слов (без глаголов около 180 - 190). Данный список слов надо было выучить самостоятельно по методичке, которая выдавалась заранее.
Этого было достаточно, чтобы человек после тренинга мог читать, понимать, переводить английские технические тексты по понятной ему теме, и даже, на основании данного “интенсива”, сдавать экзамен по языку на кандидатский минимум. Может для кого-то это звучит неправдоподобно, но факт остается фактом, и убедиться в нем легко, просто посетив бесплатное занятие, которое дает представление о его подходе.
Возникает вопрос: “А как же другие слова? Их же все равно надо как-то учить.”
Как ни странно но, проблем с изучением, запоминанием слов становится на порядок меньше. Они учатся непосредственно из контекста. Слова существуют не абстрактно, сами по себе, а в конкретных предложениях и фразах, общий смысл которых человек научается понимать благодаря данному методу. Даже если почти нет ни одного знакомого слова! Ну примерно так как мы, русскоговорящие, понимаем фразу Л.В. Щерба: “Глокая куздра штеко будланула бокра...”
Обычная ситуация: Вы сталкиваетесь со словом, которое недавно уже встречалось, но Вы не можете вспомнить его перевод. Открываете словарь, переводите а на следующей станице опять тоже самое.
Если Вы обучились понимать текст по методу Владислава Милашевича, у Вас такой проблемы нет. Если вы не помните перевод, Вы просто читаете в обычном режиме. О значении слова, хотя бы примерно, Вы догадываетесь из контекста, этого бывает достаточно, чтобы перевод слова автоматически всплывал у Вас из памяти.
В данном методе проблема выучить только те первые 180 - 230 слов. Кстати, частично этому могут помочь схемы, которые выложены бесплатно на Lingup.pro
Natural Language Processing.
Когда Вы вносите в строку “гугла” или “яндекса” поисковый запрос, например “обучение по макметоду”, а потом нажимаете на “ввод”, то на серверах поисковиков включаются процессы по обработке естественного языка.
Одним из первых пунктов в этом процессе стоит задача убрать из запроса не релевантные слова. В данном конкретном примере будет вычеркнут из запроса предлог “по”. Это так называемые стоп или шумовые слова, которые слишком часто встречаются практически во всех текстах. Они в них занимают около 30 и более %. На основе статистик такие списки stopwords составлены для каждого языка. Для английского языка он содержит в минимальном составе 119 слов.
Если внимательно посмотреть на него, то мы обнаружим большое сходство со списком словарного минимума составленный Милашевичем: те же артикли, местоимения, предлоги и союзы, служебные глаголы и их формы. Только если для поисковых машин эти слова - это шум, то в методе Милашевича - это “инфраструктура” предложения, которая помогает понять его смысл.
В конце пара рекомендаций:
- При изучении любого языка начинайте пополнять свой словарный запас с заучивания стоп-слов.
- Постарайтесь при их изучении найти схемы, рисунки, которые позволят Вам максимально структурировать эти слова для себя. Для каждого слова ищите аналоги, “якоря” в Вашем личном языковом опыте.
