Идея разработать действительно полезный новостной агрегатор, чтобы он при этом отличался от тысячи других конкурентов, пришла Александру во время обучения на курсе «Основы проектной деятельности». «Когда я увидел возможность работать с новостным агрегатором, то сразу понял, что из этого может получиться интересный проект. Я предложил выйти за рамки задания для создания действительно нового и удобного сервиса, и после тщательной проработки плана заказчик и команда меня поддержали», — отмечает Александр Чеченев.
Александр так загорелся идей, что за пару дней придумал «фишку» проекта — не просто размещать новости, а использовать специальные алгоритмы, которые позволят любому желающему получить краткую выжимку по новости. Она формируется в виде 10 наиболее интересных фактов и цитат из различных статей по одной новости.
Так на свет появился проект Findly — новостной сервис, который может провести онлайн-поиск и анализ любой новости при помощи искусственного интеллекта за 10 секунд. Интересные новости по различным темам каждый день автоматически публикуются в приложении, также пользователям доступен анализ по любым запросам через telegram-бота.
Проект Александра предлагает принципиально новый подход для новостных агрегаторов. Зачастую молодым людям неинтересно читать длинные статьи, и они редко задумываются о достоверности источника, поэтому Findly берет эту работу на себя. Алгоритм прописан так, что сервис сам, без участия человека, ищет интересные статьи по запросам на авторитетных сайтах, читает их, вычленяет из новостей факты и находит самую полную и нейтральную новость, которую и выдает пользователю. Более того, сервис предупреждает читателя, если какие-то статьи содержат предвзятое отношение к событию. Также автоматически выделяются теги (ключевое содержимое): по ним можно фильтровать новости и получать рекомендации из похожих статей.
Разработанный алгоритм является практически идеальной системой для фильтрации и оценки контента и работает точнее, чем большинство алгоритмов, представленных на рынке. Он использует не поиск статей, в которых больше всего раз встречается поисковый запрос, как это делают поисковые системы, а улучшает уже существующую выдачу, отмечая самой интересной ту статью, в которой больше всего различных фактов по теме. Для этого используется матрица смежности: весь контент развеивается на леммы (Ле́мма — начальная, словарная форма слова. Например, существительные и прилагательные — им. падеж ед. ч., глаголы и глагольные формы — инфинитивы. — Примеч. Ред.) и на основе их пересечений и работает алгоритм.
Интересный факт, что во время работы над Findly команда Александра столкнулась с весьма необычными трудностями. Алгоритму, который отвечает за поиск нейтральных новостей, нужно было четко прописать, какие части речи он должен искать в тексте и какую важность они занимают в предложении. Например, если используется стандартный алгоритм анализа (всего их пять), то наиболее важными считаются числительные. Нельзя попросить алгоритм фильтровать новости, например, с оценочным словом «восхитительный». Сервису нужно дать четкий алгоритм для работы с каждой леммой: например, все вспомогательные части речи из предложений удаляются, а остальные помогают оценить практическую значимость всего предложения, исходя из важности каждого слова. «Нам пришлось с новыми силами погрузиться в школьную программу русского языка, хотя, казалось бы, мы работаем над IT-проектом», — отмечает герой.
Первая новость, которая прошла через тестирование агрегатора, была о том, что актеру Милошу Биковичу дали российское гражданство. Ее пришлось десятки раз прогонять по тогда еще очень медленно работающему алгоритму, устранять множество ошибок, редактировать и улучшать способ фильтрации. Александр уже начал расстраиваться, что и со следующей новостью его ждет бесконечный путь устранения ошибок, но все прошло идеально. «Тогда и пришло осознание, что несмотря на другую тему и приоритеты алгоритм сработал правильно, значит, он получился универсальный. Тогда я и понял, что иду в верном направлении!» — вспоминает Александр. Конечно, проект не состоялся бы без помощи наставников: советы по технической реализации команде давал Василий Михайлович КРУНДЫШЕВ — инженер-исследователь Центра кибербезопасности цифровых технологий Политеха.
Проектом Findly заинтересовались бизнес-инкубатор «Ингрия» и Российская академия наук. РАН оценила новостной сервис в 4 млн рублей и готова профинансировать его доработку: необходима персонализация, социальные функции и отсутствие зависимости от других сервисов. После выполнения всех работ Александр планирует продать проект заинтересованным компаниям.
«Молодым людям, которые боятся сделать первый шаг, главное побороть свою неуверенность и страх. Ежедневное улучшение приложения в течение месяца позволило добиться того, что сайт набирает почти 100% в рейтинге производительности Google, в то время как у общеизвестных новостных агрегаторов этот процент в несколько раз ниже», — отмечает наш герой.