Математик взломал сайт знакомств и нашёл девушку мечты

отметили
30
человек
в архиве
Математик взломал сайт знакомств и нашёл девушку мечты
35-летнему математику Крису Маккинли (Chris McKinlay) из Калифорнийского университета в Лос-Анджелесе потребовалось всего 88 дней, чтобы осуществить дата-майнинг анкет на сайте знакомств и подобрать девушку, которая идеально подходит по характеру. Помог ему в этом доступ к суперкомпьютерам Калифорнийского университета, пишет Wired.

В июне 2012 года Маккинли работал над докторской диссертацией по обработке больших массивов данных и параллельным методам вычислений. В какой-то момент он решил отвлечься и зарегистрироваться на сайте знакомств OkCupid. Нужно заметить, что этот сайт основан гарвардскими студентами и использует хитрую систему вычисления совместимости между потенциальными партнёрами. Каждый из них отвечает на сотни вопросов о своём характере, привычках и предпочтениях. Вопросы самые разные: «Любите ли вы кошек?» (какие ответы вы приемлете от других), «Как часто вы используете Facebook?», «Как долго планируете встречаться?» и т.д. После этого вы можете посмотреть, насколько тот или иной человек подходит вам. Система показывает вероятность успешных отношений, дружбы и вражды.

Логика в том, что чем больше партнёры похожи, тем лучше им будет друг с другом.

Хитрость в том, что посмотреть, как ответила девушка на определённый вопрос, можно только после того, как вы сами ответите на него. При этом максимальное количество для каждого участника ограничено 350 ответами, в то время как общий банк содержит тысячи вопросов. Другими словами, некоторые ответы девушек навсегда останутся для вас загадкой, а «рейтинг совместимости» может оказаться слегка неточным.

Маккинли нашёл всего лишь около 100 девушек, у которых показатель совместимости превышал 90%, но даже с ними свидания как-то не сложились (Криса хватило на шесть свиданий). И тогда парень придумал способ, как провести анализ по своим собственным правилам.

Крис создал 12 фейковых профилей, отвечая на вопросы случайным образом. После этого он смог получить доступ к полным профилям девушек со всеми ответами. За три недели дата-майнинга его система собрала 6 млн ответов от тестовой выборки из 20 тыс. анкет.

После фильтрации осталось 5000 девушек, которые живут в Лос-Анджелесе и Сан-Франциско и заходили на сайт в течение последнего месяца. Крис написал скрипт на Python для сортировки девушек с разными характеристиками на семь кластеров, вроде «Заботливые», «Верующие», «Татуировки» и т.д.

источник: habr.habrastorage.org

Два кластера он нашёл особенно интересными. В первом были девушке примерно 25 лет хиповатого стиля, музыканты и актрисы. Во второй кластер вошли более старшие девушки с креативными профессиями в литературе и дизайне. Так что Крис создал два своих профиля, чтобы сфокусироваться на каждом из этих кластеров — и ответил на 500 самых популярных вопросов в каждой из групп. Здесь уже Крис отвечал на вопросы честно, хотя слегка оптимизировал ответы в зависимости от кластера…
Добавил yache yache 25 Января 2014
проблема (1)
Комментарии участников:
Marlan
+3
Marlan, 25 Января 2014 , url
за июль математик смог провести 55 свиданий. В трёх случаях дело дошло до второго свидания, но всё безрезультатно, и только на 88-м свидании Крису повезло и он нашёл поистине родственную душу, 28-летнюю художницу, с которой у него был рейтинг совместимости 91%. Сейчас они собираются пожениться.
Как романтично… ))))

Интересно, а если бы он провел свидании с 200-300 случайными девушками — может результат был бы не хуже.))
u.nik.myopenid.com
+3
u.nik.myopenid.com, 25 Января 2014 , url
Маккинли нашёл всего лишь около 100 девушек, у которых показатель совместимости превышал 90%, но даже с ними свидания как-то не сложились (Криса хватило на шесть свиданий).
30 июня компьютерная часть квеста закончилась и наступило время свиданий. К 20 июля Крис обратил внимание, что женщины из первого кластера часто живут в дальней части города, а у женщин второй группы часто есть собачка среднего размера. Для экономии времени он удалил профиль первой группы и сократил количество кандидаток вдвое. За июль математик смог провести 55 свиданий. В трёх случаях дело дошло до второго свидания, но всё безрезультатно, и только на 88-м свидании Крису повезло и он нашёл поистине родственную душу

Думаю, если бы он не парился и провел сотню свиданий без всякой математики, кончилось бы так же. Чел просто нашел себе мотивацию продолжать.
mumu
0
mumu, 26 Января 2014 , url
Логика в том, что чем больше партнёры похожи, тем лучше им будет друг с другом.
Логика в том, что чтобы иметь профит, надо отвечать на все вопросы как баба.
/thread
vguzev
+1
vguzev, 26 Января 2014 , url
Ничего этот математик не взламывал, заголовок желтушный. Тупо пропарсил весь сайт и обработал информацию…
comander
0
comander, 27 Января 2014 , url
если понимать разницу между хаком и кряком то заголовок абсолютно точный
How a Math Genius Hacked OkCupid to Find True Love
vguzev
0
vguzev, 27 Января 2014 , url
Взлом сайта подразумевает получение доступа к исходному коду сайта/базам данных и/или его дефейс/поломку. Ничего из этого сделано не было. Чувак просто скачал весь сайт к себе на компы и обработал информацию.
comander
+1
comander, 27 Января 2014 , url
хак =/= взлом.
взлом это crack
хакер это тот кто умеет изящно решать/обходить технически нетривиальный задачи.
(лайф-хак — о том же.)
другое дело что в массовой культуре хакер и кракер смешаны до полной идентичности.
например билла гейтса и линуса торвалбдса можно смело записыват в хакеры, не смотря на то что они ничего не ломали


Войдите или станьте участником, чтобы комментировать