Kim jest Watson?

Tego typu newsy zazwyczaj docierają do mnie z szerokiego świata internetową pocztą pantoflową. Ajbiemowski dział reklamy i PR-u nie spisał się więc najlepiej, skoro o Watsonie dowiedziałem się dopiero na wykładzie z lingwistyki obliczeniowej — profesor ubarwił bowiem prezentację konkretnym przykładem zastosowania teorii. Kim jest Watson?

Swojego czasu IBM stworzył komputer, który wygrał w szachy z samym Kasparovem (choć Kasparov ma co do tego wątpliwości). 14 lutego bieżącego roku inne dziecko informatycznego giganta ma z kolei pokonać Brada Ruttera i Kena Jenningsa, amerykańskich wymiataczy teleturnieju Jeopardy! (w Polsce znanym jako Va banque, pamiętacie, Kazimierz Kaczor). Watson — nazwany tak na cześć nie Johna, pomocnika Sherlocka, lecz Thomasa J., założyciela IBM — jest komputerem potrafiącym odpowiadać na "pytania" padające w programie. Nie mniej, nie więcej. Oczywiście, pytania mogą wywodzić się z dowolnej kategorii, a Watson nic o nich zawczasu nie będzie wiedział i w trakcie programu będzie zdany wyłącznie na własne siły.

Maszyna powstaje w ramach projektu DeepQA. Jego celem jest stworzenie systemu komputerowego zdolnego do "głębokiego" rozumienia pytań zadawanych w naturalnym (tzn. zwykłym) języku. Oraz, rzecz jasna, do udzielania sensownych, wyczerpujących odpowiedzi na podstawie dostępnej bazy wiedzy. Bezprecedensowe przedsięwzięcie wymaga od IBM stworzenia zaawansowanych algorytmów kontekstualnych: Parsowanie zadawanych pytań słowo po słowie prędko skończyłoby się absurdalną klęską, podobnie jak przeszukiwanie Wiki- i innych -pedii metodą brute-force. Natomiast jeśli inżynierom z IBM uda się dokonać rewolucji w tej dziedzinie, doczekamy się wkrótce następcy Gugla radzącego sobie nie tylko z zapytaniami typu Wymień wszystkie dziewiętnastowieczne zabytki Szczecina, lecz również z Jakie są wspólne elementy twórczości Słowackiego i Mickiewicza?.

Oczywiście, musimy być przygotowani, że od czasu do czasu usłyszymy w odpowiedzi: Przykro mi, Dave, ale obawiam się, że nie mogę tego zrobić.

Reklamy