Архив метки: TOR анонимность

Применение лингвистического анализа для деанонимизации в Сети

Интересная новость попалась на днях: центр исследования чтения из Бельгии провел исследования, целью которых являлось выявить разницу между словарным запасом мужчин и женщин.

Специально для этого они попросили более полумиллиона людей пройти простой тест – отмечать появляющееся на экране слово пометкой – известно им это слово или нет. Ниже представлена выборка, демонстрирующая максимальную корреляцию между полами с перевесом в мужскую сторону.

  • кодек (88%, 48%)
  • соленоид (87%, 54%)
  • голем (89%, 56%)
  • мах/mach (93%, 63%) — в английском языке mach имеет единственное значение, в отличие от русского
  • хамви (88%, 58%)
  • клеймор (87%, 58%)
  • ятаган (86%, 58%)
  • кевлар (93%, 65%)
  • паладин (93%, 66%)
  • большевизм (85%, 60%)
  • бипед (86%, 61%)
  • дредноут (90%, 66%)

А теперь посмотрим на выборку слов, которая отражает превосходство женщин:

  • тафта (48%, 87%)
  • локоны/tresses (61%, 93%)
  • бутылочный ёршик/bottlebrush (58%, 89%)
  • оборка/flouncy (55%, 86%)
  • маскарпоне (60%, 90%)
  • декупаж (56%, 86%)
  • прогестерон (63%, 92%)
  • глициния (61%, 89%)
  • тауп (66%, 93%)
  • отделка оборками/flouncing (67%, 94%)
  • пион (70%, 96%)
  • корсаж (71%, 96%)

Минусом данного анализа является тот факт, что он проведен для носителей английского языка, но провести экспериментальные работы для носителей русского языка пока никто не додумался, или – как всегда – есть более первоочередные задачи. Впрочем, краткий эксперимент из 5 слов, проведенный мною среди ближнего окружения только подтверждает выводы 🙂 (фейспалм)

В целом – анализ весьма интересный, и позволяет надеяться, со временем методы лингвистического анализа, которые давно и успешно применяются для деанонимизации в Сети будут улучшены.

Так и вижу в некотором не совсем отдаленном от нас будущем – радость маркетологов, которые присоединились к анонимному чату в TOR, и начинающим вдруг понимать, что юзер под ником SFFS12 – на самом деле мужчина в возростной категории от 30 до 32, проживающих там-то и там-то, совершающий покупки по таким-то дням, увлекающийся тем-то и тем-то … А ведь так и будет 🙂

Продолжая тематику анонимности в Сети…

… нельзя не вспомнить знаменитую Луковицу — систему TOR, разработанную непоймикогда в военно-морской лаборатории США, и рассекреченной в теперь уже далеком 2002 году. Не знаю, в каких целях планировали использовать эту технологию военные, мы же — борцы за имидж Клиента — используем ее (в числе многих других инструментов) для эмуляции работы с целевым сайтом лицами, разделенными километрами и городами.

TOR

Основные недостатки, с которыми пришлось столкнуться лично мне — ограниченное количество хостов, которые неизбежно повторяются при работе с большими объемами трафика. Я специально не касаюсь тематики уязвимости TOR, ибо в моей практике это не является определяющим фактором (кому интересно — Google в помощь)

Отдельным пунктом следует отметить планируемые изменения в законодательстве Российской Федерации (а любые изменения в законах РФ автоматически принимаются как сигнал к подобному в Украине), запрещающего не только TOR, но и вообще все анонимайзеры, а так же ставящие вне закона разработки подобных технологий и методов. Судя по всему — законотворцы не понимают, что запретить TOR без запрета VPN (а запрет VPN автоматически ставит большой и жирный крест на безопасности вообще и операционной системы Windows за используемый протокол PPTP в частности… а еще корпоративных локальных сетей, SSH, да и Linux прицепом) нереально, но чего не сделаешь ради борьбы с терроризмом и инакомыслием?