Социологи показали возможность на автомате распознавать возраст, пол, психологические данные пользователей соцсети Facebook по их статусам. Со слов ученых стало понятно, что это дает возможность формализовать наблюдения, дает инструмент для проведения экспериментов.
В рамках трудов работники американского университета Пенсильвании, английского Кембриджского университета изучали лексику, применяемую в статусах соцсети. Статус - короткий текст, который размещен от имени пользователя странички в соцсети. В тексте указывают обычно занятие, настроение, иные данные. Социологи проанализировали информацию о 136 тысячах пользователей, которые обновили свою строку статуса в общей сложности свыше 13 миллионов раз. Для получения четких данных, ученые брали лишь тех, кто за период исследования составил свыше 1 тысячи слов в строку статуса. В результате выборка авторов эксперимента включала почти 15,5 миллиона статусов из 309 миллионов слов от почти 75 тысяч человек, пишет издание "Comments".
После этого эксперты взяли заполненные теми же пользователями онлайн-опросники, искали корреляции встречаемости разных слов в статусе с разными характеристиками личности. Математический анализ материала показал, что сочетания символов, выделенных в слова формально, помогают понять, например, пол пользователя. Сочетание цифры 3 и знака «меньше» дает возможность говорить, что статусная строка обновлена дамой, а не парнем. При этом, ругательство fuck говорит о мужском поле владельца страницы.
Эксперты предложили добровольцам также установить приложение My Personality с опросниками, которые основаны на тесте NEO-PI-R. Данный тест выдавал итоги по 5 шкалам: сговорчивость, экстраверсия, сознательность, открытость и невротизм. При этом, сокращенная версия теста использовалась в иной посвященной сети Facebook работе.
Анализ показал, что экстраверты чаще пользуются словами "вечеринка", "девушки", при том, что интроверты выбирают Интернет и компьютеры, а также аниме — а коэффициент корреляции для аниме, интроверсии ниже, чем для смайла и интроверсии "^_^". Также видны были характерные для определенного возраста словосочетания, к примеру, "домашнее задание", названия предметов больше выдают школьников, а "муж" или "дочь" характерны для лиц, старше 30 лет.
Эксперты думают, что их работа помогает отделять стереотипы о разных категориях пользователей от реальных ее характеристик. Они считают удачным решение не считать частотность разных слов из закрытого списка (из списка "положительных эмоций", из множества "ругательства"), а взять сочетания символов и слова, с самого начала присутствующие в выборке. Еще один плюс подхода — это сравнительная быстрота обновления информации.