Главная Каталог ВКР Выявление пользователей социальных сетей, ведущих здоровый образ жизни

ВКР Выявление пользователей социальных сетей, ведущих здоровый образ жизни

Тип работы
Дипломная работа
Группа предметов
Программирование
Предмет
Информатика
Вуз
Не указан
Год сдачи
11 Фев
Демо-файлы
  • Нет
Файлы работы

Нужна оригинальная работа? Ответы на тесты? И многое другое можно заказать кликнув сюда 👆


3999 Р
6000 Р
Описание

На 1 февраля 2023 года оригинальность более 80%

Могу проверить вам актуальную оригинальность работы перед покупкой, пишите в личку.

Оригинал документа в pdf, конвертация в Word автоматическая (в word могут быть недочеты, которые вы легко исправите самостоятельно)

Эта работа основана на использовании обработки естественного языка и методов машинного обучения для построения классификаторов, способных предсказать, поведения и тенденции к здоровому образу жизни пользователей социальной сети ВКонтакте.

В результате этой работы, несколько классификаторов машинного обучения обучены выполнять задачу классификации пользователей на основе результатов, которые они дали в опросе, связанным со здоровьем. Различные наборы признаков, полученные из данных, собранных в социальных сетях, в сочетании с различными классификаторами, оцениваются с помощью метрики ROC AUC, чтобы определить, какая комбинация наборов признаков и классификаторов способна выполнить эту задачу. Для выполнения этой задачи используется язык программирования: Python и его различные библиотеки.

Введение

Эта работа заключается в использовании комбинации обработки естественного языка и машинного обучения для прогнозирования того, склоняются ли люди к определенному образу жизни и поведению. Результатом этой работы является оценка работы этих классификаторов машинного обучения.

Тема мониторинга здоровье общества с помощью социальных сетей получает все большее и больше интереса в научном сообществе. В источнике [1] исследователи попытались использовать методы обработки естественного языка для определения отношения пользователей социальных сетей к курению кальянного табака (ККТ). Исследователи попытались выявить потребителей с неоднозначными или смешанными взглядами на ККТ. Выявление таких людей, которые ещё не определились по поводу их отношения к ККТ, позволяет здравоохранительным органам нацеливаться на таких них и направлять им информацию, которая может изменить их мнение о ККТ. Часто когда здравоохранительные органы рассылают информацию публике о вреде употребление табака, табачные компании рассылают, в ответ, информацию которая пытается опровергнуть научные доказательства которые указывают что курение табака это вредно. Один способ избежать контратаки табачных компаний это рассылать такую информацию только некоторым людям которых можно ещё убедить о вреде курения. Методы автоматической классификации таких пользователей может сильно увеличить эффективность трудов здравоохранительных органов с борьбой против курения.

В другом исследовании [2] был использован иной подход к использованию данных, собранных в социальных сетях, в качестве инструмента общественного здравоохранения. Исследователи собрали 4,5 млн. твитов, связанных с диабетом, диетой, физическими упражнениями и ожирением (ДДФуО), и проанализировали их с целью выявления корреляции между этими темами.


Эта работа разделена на введение, четыре главы, заключение и списка литературы.

Введение состоит из мотивации этой работы, списка целей, которые должны быть достигнуты в этой работе, и список завязанных работ, над которыми работают другие академики.

Первая глава этой работы состоит из фундаментальных основ машинного обучения и истории машинного обучения.

Вторая глава этой работы состоит из различных методов, которые могут быть использованы для подготовки текстовых данных для использования в процессе машинного обучения.

Третья глава работы описывает различные способы оценки и тестирования моделей машинного обучения.

Четвертая глава описывает пошаговый процесс извлечения из текста наборов признаков и их использования для обучения классификатора Random Forest.

Вывод состоит из анализа всех результатов, собранных в ходе этой работы.

Оглавление

Содержание ..................................................................................................... 3 Введение .......................................................................................................... 4 1. Теоретические сведения из машинного обучения ................................ 8

1.1 История машинного обучения ............................................................... 8 1.2 Основы машинного обучения .............................................................. 10

2. Обзор инструментов ............................................................................. 13 2.1 Очистка текста ...................................................................................... 16 2.2 Методы отображения данных .............................................................. 17 2.3 Методы оценки моделей ...................................................................... 23

3. Практика ................................................................................................ 38 3.1 Классификация пользователей соцсетей ............................................ 43 3.2 Признаки и методы .............................................................................. 46 3.3 Результаты ............................................................................................ 50

Заключение .................................................................................................... 53 Приложения ................................................................................................... 55 Список используемой литературы ............................................................... 58


Если Дипломная работа на тему ВКР Выявление пользователей социальных сетей, ведущих здоровый образ жизни Вам не подходит? Не беда! посмотрите похожие работы в Нашем поиске:)