Russian Chicago - Русский Чикаго
Visit Russian America, Russian Community in USA
Russian Chicago. Russian speaking community in Chicago, IL
Russian Chicago News. Новости на Русском ЧикагоNews Russian Chicago - Events. События и Афиша на Русском ЧикагоEvents Russian Chicago Yellow Pages. Жёлтые страницы Русского ЧикагоYellow Pages Russian Chicago Classfieds. Объявления на Русском ЧикагоClassifieds Russian Chicago Forum. Дискуссионный клуб Русского ЧикагоForum Russian Chicago Dating. Знакомства на Русском ЧикагоDating Russian Chicago Chat. Чат на Русском ЧикагоChat
 Entertainment
Home
  
Анекдоты
  отобранные
Истории
Загадки
Афоризмы
  
  
Картинки
  Эро-юмор
  Этикетки
  
Рассылки
  Гороскоп по почте
  TV-программа
  Анекдоты
  ... еще ...

  
Открытки
  Поздравь друга
  
  
Игры
  Классические
  Спортивные
  Игровые автоматы
  Забавные

Игры на
компьютере


  
Читальный зал
  Стихи
  Проза
  Кулинария

Едем в Америку!
  Иммиграция
  Визы
  Советы

Обзоры Exler.ru
  Web Обзоры
  Обзоры фильмов
  Рассказы
  ЭКСпромт:
  Для чайников

Гороскопы

Знакомства
  
Фотоальбомы
  America views
  Personal
  Создай свой альбом
  
Последние новости со всего мира.
Рассылки:
  Новости-почтой
  TV-Программа
  Гороскопы
  Job Offers
  Концерты
  Coupons
  Discounts
  Иммиграция
  Business News
  Анекдоты
Многое другое...
 Другие ресурсы
NEWS CENTRAL
  
Программа TV
Finance News
Мода
Кино
  Новости кино
  Кинообзоры
Спорт
Музыка

  Штаты
Едем в Америку!
  Иммиграция
  Визы
  Советы

Russian America Journal Digest
  
Yellow Pages
Объявления
Чат
Форум
  последнее
Top Rating
  America TOP
  
 
Entertainment HomeАнекдоты
Компьюлента. 4 марта 2003 года, 11:15

Американский ученый Джон Клайнберг из Корнелльского университета предложил новый способ фильтрации информации, позволяющий выявлять наиболее актуальные для каждого конкретного момента времени проблемы и темы для обсуждений. Способ, предложенный Клайнбергом, основывается на анализе больших объемов текстовой информации с целью выявления наиболее часто встречающихся слов. Когда происходит какое-либо важное событие, о нем начинают говорить и писать очень многие. Это приводит к своеобразным "скачкам" в частоте употреблении тех или иных слов.

Взяв за основу эту идею, Клайнберг разработал алгоритм, позволяющий анализировать частоту использования того или иного слова. На выходе алгоритм представляет собой рейтинг слов, на основании которого можно делать выводы о популярности той или иной темы и производить сортировку информации.

Само собой, что из рейтинга должны исключаться служебные части речи: артикли, предлоги, союзы, а также наиболее распространенные местоимения, числительные и слова общеупотребительной базовой лексики, например, "время", "больше", "меньше" и т.д. Ведь именно эти слова встречаются чаще всего, однако установить по частоте их упоминания какие-либо тенденции вряд ли возможно. Например, в рейтинге слов Usenet первое место занимает определенный артикль "the", второе - предлог "to", а третье - предлог "of". В первой десятке также находятся неопределенный артикль "a", союз "and", глагол "is" и местоимение "i". Сделать на основании вершины этого рейтинга какой-либо анализ едва ли получится.

Система Клайнберга, однако, работает гораздо эффективнее. Чтобы испытать свою разработку, он заставил ее проанализировать тексты всех президентских докладов о положении в США (State of the Union addresses), начиная с 1790 г. В итоге получилось, что в период Войны за независимость американских колоний часто употреблялись слова militia ("ополчение") и British ("британский"). А в период с 1947 по 1959 годы наблюдался "скачок" в использовании слова atomic ("атомный"). Таким образом, удалось доказать работоспособность системы.

Использовать разработку Клайнберга можно в самых разных областях. Сам ученый собирался создать на ее основе утилиту для фильтрации электронной почты, которая на основе частоты упоминания слов определяла бы важность писем. Важным проблемам могут быть посвящены письма многих людей, которые будут использовать одни и те же слова. Это позволит отделить "зерна от плевел". Помимо этого, технологию можно будет использовать для повышения релевантности поиска в интернете, а также для выявления наиболее "горячих" новостей и дискуссионных тем.

Например, создав рейтинг слов, употребляемых в блогах - онлайновых дневниках, получивших за последний год бешеную популярность, можно определить, о чем предпочитают говорить пользователи интернета. Такая информация может представлять интерес для журналистов, ищущих темы для своих репортажей, маркетологов, которые смогут эффективнее выявлять предпочтения пользователей и корректировать соответствующим образом рекламные кампании. Наконец, рейтинги слов в блогах окажут помощь и государству, которое сможет следить за умонастроениями граждан. Последнее, впрочем, относится лишь к странам, где интернетом пользуется более половины населения, в противном случае, выборка для анализа получится непредставительная. Рейтинг упоминаемости слов в блогах уже существует и располагается на сайте Daypop.

  1. Обнаружена троянская программа Glieder...

  2. Компьютерная телефония как средство повышения школьной дисциплины...

  3. Новая дыра в популярном почтовом сервере Sendmail...

  4. Во втором квартале 2003 года вырастут цены на диски DVD-R...


  5. Карманный компьютер Sony PEG-TG50 на основе Palm OS 5.0...

  6. ATI собирается делать чипы для второго поколения и XBox, и GameCube...

  7. Кратко: Intel опробует свои технологии в отелях Marriott; МТС приходит в Самару; VeriSign объявляет о запуске инфраструк...

  8. Биокомпьютер считает в 100 тысяч раз быстрее...

  9. Новый GSM-телефон Samsung SGH-S307...

  10. В ближайшие два с половиной года китайцы полетят на Луну...

  11. Российская компания победила eBay в суде...

  12. Первый плеер с поддержкой открытого аудиоформата Ogg Vorbis...

  13. Слежка за сексуальным маньяком будет вестись при помощи GPS-передатчика...

  14. MD Group стала официальным дистрибьютором D-Link...

  15. Дело о программе DeCSS для взлома DVD направлено на повторные слушания...

  16. Новая волна увольнений в Palm...

  17. Компактный 3,2-мегапиксельный фотоаппарат Olympus Camedia X-200...

  18. Новая техническая информация о Radeon 9600 и Radeon 9800...

  19. Epox расширяет свое присутствие на рынке Северной Америки...

  20. Билл Гейтс снова признан самым богатым человеком в мире...

 

Случайные анекдоты

  • Новый интернет-проект ИД "Компьютерра"...

  • Субноутбук Sony VAIO type T...

  • Nvu - аналог DreamWeaver и FrontPage с открытым кодом...

  • Системная плата DFI KM266Pro-MLV Rev. B для процессоров AMD...

  • Новый истребитель Су-27СК будет представлен на выставке в Китае...

    АНЕКДОТЫ

  • Ежедневные
  • Отобранные
  • Новые
  • Коллекция
    Архивы:
  • 1 2 3 4
  • 5 6 7 8 9
  • 10 11 12 13 14
  • 15 16 17 18 19
  • 20 21 22 23 24
  • 25 26 27 28 29
  • 30 31 32 33 34
  • 35 36 37 38 39
  • 40 41 42 43 44
  • 45 46 47 48 49
  • 50
    * * *
  • Истории
  • Афоризмы
  • Загадки


  • Terms of Service | Privacy Policy | Site Map | Advertise
     
    Russian America Top Russian Boston Russian LA Holostyak.com Рейтинг@Mail.ru © 2025 RussianAMERICA Holding
    All Rights Reserved • Contact