Previous Entry Share Next Entry
(no subject)
sky
northern_wind
Внезапный соцопрос. Я сейчас помогаю дорабатывать систему анализа новостей (scan.interfax.ru). Если вдруг кто-то близок к такой аналитике - не мелькало ли у вас мыслей в духе "хорошо чтобы такая-то функция была"? Что это были за функции?

  • 1
Я близок в том смысле, что сейчас у нас одна компания выиграла тендер на мониторинг с... э... элементами аналитики, если это можно так назвать, и я с ними общаюсь, пытаясь объяснить, чего мы, собственно, хотим.

Мне лично очень не хватает такой подачи материала (наличия этих функций одновременно):

- чтобы публикации делились на сюжеты;
- чтобы предлагались "похожие публикации" по типу упоминания лица или организации или места - как внутри "сюжетного облака", так и, возможно, архивные;
- чтобы СМИ были отсортированы по федеральному/региональному признаку или по индексу цитирования, или по признаку попадания в Яндекс.Новости, например, - чтобы РГ и "Известия" отдельно, "Москва24" и "Советская Чувашия" отдельно, отраслевые полурекламные порталы и самопубликаторы - тоже как-то отдельно; ну и мусорные пессимизированные сайты, на которые боты натащили инфу, чтобы "что-то новое было", тоже где-то бы присутствовали.

Но это только исходя из моей ситуации, нетипичной с точки зрения нормального поиска/анализа информации.

хм, кажется, у нас это есть или сейчас реализуется. значит, не зря мы это ваяем.
спасибо!

Прошу прощения, я про сортировку по региональному принципу мутно сказал.
По сюжетам (формирование облака "Похожих публикаций") - да, это у вас есть, и это здорово! Наши поставщики мониторинга дают некорректно.
И, как сказали ниже, сортировка по времени - с детальной нарезкой по периодам. Но я, как всегда, плохо описал то, что мне нужно.

Ну почему же, по региональному принципу как раз похоже на то, что у нас.
По времени у нас есть и давно. :)

Такое ощущение, что нам пора перестать заниматься допиливанием системы и начать заниматься пиаром. %)

отдельное спасибо за идею с похожими публикациями!

Не знаю точно, что подразумевается под анализом новостей, но мне было бы важно:

Иметь возможность настраивать фильтры для ленты:
* по регионам (Мир, бывшее СНГ, Россия, регионы России - дада, все 90 штук). Зачастую мне неинтересно читать про происки вашингтонского обкома или землетрясения на островах Кука.

* по тематикам более подробным, чем сейчас. основная цель - отделить факты от бреда (типа криминальных новостей про то, как бомж съел кавказца, про то, как виновная в дтп одноногая собака-священник скрылась с места преступления, типа псевдосоциологии британских ученых, групповух и смертей звезд "культуры" и пр. и пр.)

* по времени - возможность фильтровать сообщения не только "за последние полгода", но и "от сих до сих".

* облака тэгов и прочая связность, боюсь, не работает с новостями, но было бы круто иметь возможность не только тэгов для персон, которые часто есть, но и организаций (включая организаций, в которых работают эксперты-ньюсмейкеры или комментаторы) - но это малореально, т.к. требует много труда.


Уже это - огромный труд, так что остановлюсь.

Ну и плюс интерфейс должен быть чист и удобен, без лишних ссылок и псевдоинтеллектуального "смотреть также". или это "смотреть также" должно быть очень умным. Но на самом деле, грамотная и подконтрольная пользователю система фильтров сейчас всё равно будет лучше чем автоматические подсказки.

Было бы круто, если бы можно было делать экспорт RSS такой настроенной ленты.

Ооо.
Спасибо-спасибо-спасибо, это ровно то, что нужно.

Будет круто, если продолжишь.

Тэги для организаций и фильтры по регионам как раз в нашем случае легко реализуются, есть предпосылки к этому.

По времени уже фильтруем и настраиваем.

Давай так. Я сначала расскажу, что уже есть.
Есть автоматически заполняемая онтология с каким-то количеством вручную созданных pivots. С ее помощью в текстах новостей выделяются организации-места-персоны-бренды. По возможности привязываются к ранее извлеченным из других текстов сущностям то.
Сделать из этого тэги вообще не проблема.

Ленты сейчас нет, есть алерты и мониторинги. Как я понимаю, было бы неплохо реорганизовать это в ленту?

А ты сравнивала вообще функционал с public.ru?
У меня все коллеги по нему делают дискурс-анализ всяческий..

Не сравнивала.

Оно закрытое все, на тестовый доступ нужно какое-то время.
То, что ты перечислил, там есть?

В другом формате, но да, есть. Ну и плюс там оффлайн сми тоже индексируются, и масса всего. Собственно, в Вышке на нее подписка, через нее все основные исследования такого рода делают.

Я просто сперва не понял, но scan.interfax.ru именно такую услугу пытается продавать. Я-то думал, это просто довесок к самой ленте, а там тоже подписки, то, сё. Тогда надо сравнивать с конкурентами, естественно.

возможно, все это у вас уже есть, но вдруг что-то пригодится

очень важно, чтобы хорошо работало исключение новостей каких-то тэгов (в блумберге открываешь новости по конкретной компании, а там пачками анализы рынков, экономика страны, экономика группы стран...аааа)

из той же серии - помечать значимость новостей, если это возможно (если нужны новости за год, хочешь большие и жирные новости, а не список из 500 строк)

*скромно*
а можно опцию "отключить фигню и пропутина"
*извините, наболело*
...

*
наверное не в тему :)
...

в общем "всегда с тобой - фигня в твоей голове" - "реклама на русском радио"

Edited at 2013-10-20 01:23 am (UTC)

  • 1
?

Log in

No account? Create an account