воскресенье, 3 июня 2012 г.

#FollowFriday - качество взаимности, часть 2

Результат прошлой недели был предсказуем. Качество рекомендаций определяет их цену, и цена в 100 - 120 баллов за хвалебный стасорокасимвольный очерк теперь достижима. Стоит ли остановиться на этом? Глупый вопрос)), тем более в начале статьи, конечно же нет! Тогда попробуйте предугадать: на какой вопрос, связанный с FF, я ищу ответ, чему посвящен следующий FF-эксперимент? Вероятные ответы: "Ну, наверное, как получить заветный BINGO в 150 очков за рекомендацию...как ЕЩЕ более правильно рекомендовать своих друзей по пятницам..." ГЫ!

Здравствуйте, мои дорогие!
Не случайно первую и вторую части моей саги о #FollowFriday разделяет странный "спецвыпуск" о лени, вдохновении и сочетании их с инстинктом взаимности, выразившимся в некой попытке сохранить простоту рекомендательного процесса "в один клик" с одной стороны, и дать другу заветные >100 баллов. Короче говоря "влезть на ёлку и ...опу не ободрать". Желание свойственное нормальному русскому человеку))). Процессу "влезания на елку" посвящен сегодняшний пост. Точнее сомнениям и вопросам, к которым меня этот процесс влезания привел.



Словарь Эллочки.

Словарь Вильяма Шекспира, по подсчету исследователей, составляет 12.000 слов. Словарь негра из людоедского племени «Мумбо-Юмбо» составляет 300 слов... Если вам знакомы эти строки великих классиков русской сатиры, то скажите спасибо своим маме и папе: они вас правильно воспитали! А я начинаю словами классиков публикацию моего сомнения.
Сомнение первое и пока единственное: я сомневаюсь в том, что некий семантический анализатор сервера FF, семантически анализирует, собственно, хоть что-нибудь.
В рейтинге #FollowFriday участвует, без малого, 280 стран, официально заявлено 9 языков. Каким же должен быть словарь семантического анализатора? А если в рекомендациях применяются сленг и идиоматические выражения? Да-а-а)) Респект парням, которые это придумали...
Хотите прикол ;)? Не первый раз в общемировом рейтинге побеждает некто @q8tweetz, участвующий в Кувейтском рейтинге, занимающий первое место в англоязычном рейтинге и, при этом, публикующий ВСЕ свои твиты на арабском языке! #яваляюсь. Можете проверить: большинство из его рекомендателей рекомендуют исключительно на арабском. 


Эксперимент.

Мой эксперимент будет стремительным. Берем мальчика для битья (я говорю о @dobrotweet, несмотря на то, что на аве изображена девочка)), берем FFValidator и какой-нибудь сервис по переворачиванию текста, делаем рекомендацию:
Проверяем твит через FFValidator и... Вуаля! 113 очков, как с куста))) Осталось дождаться, когда "суперанализатор" FF пережует нашу лабуду (4 - 5 часов) и подарит моему другу эти очки.


Мораль.

Чуть меньше повезло твипам с длинными никами, меньше на 3-5 очков. А мораль в том, что от качества рекомендации цена ее не зависит, скорее от количества: количества символов в тексте рекомендательного твита.
Когда вы будете меня рекомендовать, спросите о погоде, о том, как у меня дела... И не удивляйтесь, если в моих рекомендациях не будет не только хвалебных слов, но и сколько-нибудь осмысленных))). Шутка! Я по-прежнему считаю, что рекомендация должна идти от души, я позволю себе перефразировать русского классика: "...а аршином общим русскую душу не измерить".
Приятного вам утра-дня-вечера и душевных рекомендаций! Пока!

9 комментариев:

  1. Виват! :)
    Какой ты молодец! Так просто - и в дамки!

    ОтветитьУдалить
  2. А если серьезно - то думаю, это определяется так:
    - есть так называемый уровень читабельности, идея в том, что чем сложнее текст, тем чаще в нем употребляются длинные слова и слова с наиболее редкими слогами. Т.е. такой текст считается более "научным" и "важным". По слогам - списки уже давно составлены на основе частотного вхождения в словари разных языков.
    И математически - по количеству "сообщаемой" или несущей информации такие тексты имеют выше значение.
    Вот и выходит, что длинные слова, да еще и с наиболее редкими слогами, а иногда и несуществующими в реальном языке, дают максимальное значение :).
    Еще раз пасиб! Я хотела подобное в связке твит->гугл провести, но так и руки не дошли...
    Увы, пока другого подхода нет :(.

    ОтветитьУдалить
  3. Да, я читал твои публикации о семантическом анализе текстов. Очень много материала, чтобы весь переработать и получить готовое и понятное решение для связки твит-гугл нужно реально постараться. Ценность такого решения потянет на дипломную работу; минимум!

    ОтветитьУдалить
    Ответы
    1. :) - я не так умна, как кажется :)...
      А тест - как Клоута, так и твиттера-гугл, как всегда упирается в материальную сторону: нужны много аккаунтов, время и технические возможности для эксперимента.

      Удалить
  4. Доречі, рекомендація українською чи білоруською може мати більш вагомий результат, оскільки вони ці мови ще не аналізукть :)

    ОтветитьУдалить
  5. И еще, думаю, что не все так однозначно: это видно по групповым рекомендациям - когда один твит-рекомендация тем, кто в нем перечислен, дает тоже разные значения. По-видимому еще должно учитываться:
    - рейтинг в системе того, кто рекомендует
    - рейтинг в системе рекомендуемого
    может еще история в системе #FollowFriday, например возраст аккаунта в системе (как давно зарегистрирован), и общий возраст может тож.

    ОтветитьУдалить
  6. Я проверял, все остальные критерии влияют незначительно и соизмеримо с числом фолловеров. У меня фолловеров 2800, значит моя базовая оценка 28; как-то так, я не стал разбираться потому как - мелочь, больше интересовало: а где остальные 100. Если за две недели ничего не изменилось, то групповая рекомендация без прочих слов рассчитывается как базовая оценка рекомендателя , деленная на число рекомендуемых в равных долях, но, насколько я знаю, не менее одного очка каждому.

    ОтветитьУдалить
  7. Якщо в українській мові слова довші, тоді так (via Google.Translate:)))))

    ОтветитьУдалить