Наш датасет направлен на тренировку моделей рекомендательных систем и определения категорий сайтов. В этом наборе данных мы разделили сайты на 180 тематических групп:
- образование,
- информационно-развлекательный сайт,
- университет,
- вуз, официальный сайт,
- обучение языкам,
- словарь,
- математика,
- детский центр,
- одежда для детей,
- криптовалюта,
- инвестиции,
и многие другие.