воскресенье, 7 декабря 2014 г.

Обновление сервиса онлайн мониторинга Твиттера

Как обычно бывает, первые версии программных продуктов меняются довольно быстро. На запущенном пару дней назад сервисе "слежения" за Твиттером, который доступен вот по этой ссылке, уже появились некоторые усовершенствования. В частности, расширены возможности функции поиска. Искать твиты можно было с самого начала, используя поля ввода в шапке каждой колонки, то есть по автору, содержимому и времени. Но если ранее текст искался только на вхождение, то теперь можно объединять несколько слов в запросе с помощью '%%', например:

москв%%билет

Этот запрос найдет все твиты, в которых встречаются оба фрагмента - "москв" и "билет". Порядок слов учитывается. Регистр - нет.

Также исправлены мелкие недочеты в интерфейсе.

Сервис теперь не регистрирует спам, то есть повторные сообщения с одним и тем же текстом, рассылаемые под разными учетными записями примерно в одно и то же время.

Ретвиты также пропускаются, так как они, по сути, точно такие же копии, не несущие полезной информации. Исходного твита вполне достаточно. Кто и кого сколько раз ретвитнул - это уже возведенные в культ издержки социальной ориентированности Твиттера. Конечно, апологетов Твиттера может передернуть от такой крамольной мысли, но с точки зрения анализа и извлечения полезной информации, обилие ретвитов лишь затрудняет процесс. Некоторые посчитают это странным, потому что, яко-бы, именно ретвиты обеспечивают вирусное распространение информации и широту охвата аудитории. Но широта охвата означает массовую рассылку - фактически, спам, - а не точность попадания, так что доля читателей, для которых конкретный твит будет иметь значение, мала. Это издержки модели "рассылки", которая, как ни странно, закамуфлирована в Твиттере под "подписку". Вместо того, чтобы оперативно искать именно то, что нужно в данном месте и в данное время, пользователи подписываются на нечто, вроде бы по теме, но в будущем, и с попутной, не известной заранее, "нагрузкой". Это идеология слепого потребления. Видимо, она специально культивируется, и именно поэтому функции поиска реализованы схематично.

Было бы гораздо удобнее иметь в Твиттере настраиваемые, контролируемые, индивидуальные функции поиска (когда в выдачу попадает то, что запрошено, а не то, что Твиттер посчитал нужным показать). Сейчас поиск в Твиттере - вещь в себе, впрочем как и псевдо-интеллектуальная система подсказок, кого бы Вам было интересно почитать. Вряд ли машина знает лучше Вас, что Вам нужно в данную минуту. Особенно это заметно с покупками. Например, сегодня Вас интересует какой-то предмет мебели, завтра - резина для авто, потом книги, гольф и прочие вещи. Получается, что в контексте анализа текущих цен, ассортимент товаров - самый разный, потребности - изменчивы, а оперативность сведений о цене важнее следования тренду.

Технология изучения пользовательских интересов известна уже давно и используется многими онлайн-сервисами, включая поисковики и рекламные крутилки. Под флагом так называемых больших данных потенциал выглядит сказочно, но результат обычно анекдотичен. По крайней мере пока. Чаще всего предположения программ оказываются заложниками прошлых интересов и вопросов, которые решал пользователь, с тех пор уже давно решил и занимается чем-то новым, а "интеллектуальные" подсказчики советуют все старое. Но это - лирическое отступление.

Именно отсутствие толковых функций поиска дает простор для сторонних сервисов Твиттер-аналитики. В общем-то, и облегченная версия ПрайсЛайн тоже к ним относится.

Комментариев нет:

Отправить комментарий