Анонимные транскрипты интервью, результаты опросов и поведенческие метрики, собранные за 18 месяцев.
Трансформерная модель выделила 47 ключевых паттернов выбора и сгруппировала их по эмоциональным драйверам.
На этапе постобработки из анализа исключаются: шаблонные и формульные конструкции, социально-желательные формулировки, повторяющиеся языковые маркеры без смысловой нагрузки. В итоговых данных сохраняются только базовые смысловые структуры, отражающие реальные мотивационные и когнитивные состояния.
Агрегация данных из 12 независимых источников. Очистка текста, нормализация лексики, устранение шумов и дубликатов.
Построение эмбеддингов и проекция в пониженное пространство признаков с использованием UMAP. Кластеризация плотностными методами (HDBSCAN). Группировка выполняется по смыслу, а не по частоте слов.
Выявление повторяющихся смысловых цепочек и устойчивых комбинаций факторов. Оценка относительного вклада каждого паттерна в общую структуру данных.
Результаты приводятся в виде: агрегированных AI-сводок, графов смысловых связей, визуальных карт распределения паттернов. Формат адаптирован для аналитического и стратегического использования.
Нейросетевая кластеризация и семантический анализ 3 583 анкет абитуриентов
| Проанализировано анкет | 0/3 583 |
| | |
| Выявлено мотивов | 0 паттернов |
| Ключевые критерии | 0 |
| Доля сравнений | 0% |
| Время решения | 0 дн. |