Интересная новость попалась на днях: центр исследования чтения из Бельгии провел исследования, целью которых являлось выявить разницу между словарным запасом мужчин и женщин.
Специально для этого они попросили более полумиллиона людей пройти простой тест – отмечать появляющееся на экране слово пометкой – известно им это слово или нет. Ниже представлена выборка, демонстрирующая максимальную корреляцию между полами с перевесом в мужскую сторону.
- кодек (88%, 48%)
- соленоид (87%, 54%)
- голем (89%, 56%)
- мах/mach (93%, 63%) — в английском языке mach имеет единственное значение, в отличие от русского
- хамви (88%, 58%)
- клеймор (87%, 58%)
- ятаган (86%, 58%)
- кевлар (93%, 65%)
- паладин (93%, 66%)
- большевизм (85%, 60%)
- бипед (86%, 61%)
- дредноут (90%, 66%)
А теперь посмотрим на выборку слов, которая отражает превосходство женщин:
- тафта (48%, 87%)
- локоны/tresses (61%, 93%)
- бутылочный ёршик/bottlebrush (58%, 89%)
- оборка/flouncy (55%, 86%)
- маскарпоне (60%, 90%)
- декупаж (56%, 86%)
- прогестерон (63%, 92%)
- глициния (61%, 89%)
- тауп (66%, 93%)
- отделка оборками/flouncing (67%, 94%)
- пион (70%, 96%)
- корсаж (71%, 96%)
Минусом данного анализа является тот факт, что он проведен для носителей английского языка, но провести экспериментальные работы для носителей русского языка пока никто не додумался, или – как всегда – есть более первоочередные задачи. Впрочем, краткий эксперимент из 5 слов, проведенный мною среди ближнего окружения только подтверждает выводы 🙂 (фейспалм)
В целом – анализ весьма интересный, и позволяет надеяться, со временем методы лингвистического анализа, которые давно и успешно применяются для деанонимизации в Сети будут улучшены.
Так и вижу в некотором не совсем отдаленном от нас будущем – радость маркетологов, которые присоединились к анонимному чату в TOR, и начинающим вдруг понимать, что юзер под ником SFFS12 – на самом деле мужчина в возростной категории от 30 до 32, проживающих там-то и там-то, совершающий покупки по таким-то дням, увлекающийся тем-то и тем-то … А ведь так и будет 🙂