Przetwarzanie języka naturalnego i rozumienie języka naturalnego: Szczegółowy przewodnik w 2024 r.

SPIS TREŚCI

Krok 1. Tytuł kroku znajduje się tutaj zgodnie z oczekiwaniami.

Komputery przodują w reagowaniu na instrukcje programistyczne i z góry określone polecenia w zwykłym języku, ale jesteśmy dopiero na wczesnym etapie ich rozumienia języka naturalnego.

Na przykład proste polecenie, takie jak "Odłóż słuchawkę", ma historyczne i potoczne konteksty, które kształtują jego znaczenie. Ludzki umysł szybko rozumie tę frazę, ale komputery mogą jej nie rozumieć.

Na szczęście postępy w przetwarzaniu języka naturalnego (NLP) dają komputerom przewagę w zrozumieniu sposobów, w jakie ludzie naturalnie komunikują się za pomocą języka.

Sukces w tej dziedzinie stwarza niezliczone nowe możliwości biznesowe, między innymi w zakresie obsługi klienta, zarządzania wiedzą i przechwytywania danych. Rzeczywiście, rozumienie języka naturalnego jest w centrum tego, co Botpress stara się osiągnąć jako firma - pomaganie maszynom w lepszym zrozumieniu ludzi jest celem, który inspiruje nasz rozwój konwersacyjnej sztucznej inteligencji.

Chociaż wdrażanie funkcji języka naturalnego stało się bardziej dostępne, ich algorytmy pozostają "czarną skrzynką" dla wielu programistów, uniemożliwiając tym zespołom optymalne wykorzystanie tych funkcji. Zrozumienie podstaw tego, jak to działa, jest niezbędne do określenia, jakiego rodzaju danych szkoleniowych będą używać do szkolenia tych inteligentnych maszyn. Wybór i zastosowanie odpowiednich danych treningowych ma kluczowe znaczenie dla sukcesu.

W tym artykule dokonujemy przeglądu podstaw języka naturalnego i jego możliwości. Przeanalizujemy również kilka kluczowych przypadków użycia i przedstawimy zalecenia dotyczące rozpoczęcia pracy z własnymi rozwiązaniami języka naturalnego.

Czym jest przetwarzanie języka naturalnego?

Przetwarzanie języka naturalnego to poddziedzina sztucznej inteligencji badająca interakcje między komputerem a ludzkim językiem. Jest to dziedzina nauki, która łączy lingwistykę i informatykę. Celem NLP jest przekształcenie danych wejściowych w języku naturalnym w ustrukturyzowane dane. Wykorzystuje do tego wiele zadań, takich jak tagowanie części mowy, rozpoznawanie nazwanych jednostek, parsowanie składniowe i inne.

Czym jest rozumienie języka naturalnego (NLU)?

Natural Language Understanding dotyczy rozumienia języka. Podobnie jak my, technologia może usłyszeć lub przeczytać coś bez zrozumienia tego. NLU to technologia, która zasila interfejsy konwersacyjne. Bez części rozumiejącej rozmowa jest prawie niemożliwa lub w najlepszym przypadku niezręczna.

Jak działa NLU?

Podobnie jak inne rozwiązania AI, technologia ta wymaga szkolenia. Wykrywanie intencji zależy od danych szkoleniowych dostarczonych przez twórcę chatbota i od wyboru technologii przez inżynierów platformy. Specjaliści ci muszą dostarczyć dane szkoleniowe, aby upewnić się, że narzędzie rozumie użytkowników w kontekście swojej funkcji - niezależnie od tego, czy funkcja ta obsługuje klientów zewnętrznych, czy pomaga użytkownikom wewnętrznym w zarządzaniu wiedzą. Nawet po szkoleniu NLU będzie się gubić, gdy rozmowy będą odbiegać od jego podstawowych funkcji i staną się bardziej ogólne.

Na szczęście technologie te mogą być bardzo skuteczne w określonych przypadkach użycia. Optymalizacja i przeprowadzanie szkoleń nie jest poza zasięgiem większości programistów, a nawet użytkowników nietechnicznych. Niedawne przełomy w sztucznej inteligencji, pojawiające się częściowo z powodu wykładniczego wzrostu dostępności mocy obliczeniowej, sprawiają, że stosowanie tych rozwiązań jest łatwiejsze, bardziej przystępne i tańsze niż kiedykolwiek.

"Aby uzyskać takie zrozumienie, maszyny muszą być w stanie rozumieć i generować części mowy, wyodrębniać i rozumieć jednostki, określać znaczenia słów i wykorzystywać znacznie bardziej skomplikowane czynności przetwarzania, aby połączyć pojęcia, frazy, pojęcia i gramatykę w szerszy obraz intencji i znaczenia". Forbes, "Maszyny, które potrafią zrozumieć ludzką mowę: The Conversational Pattern of AI", czerwiec 2020 r.

Język jest złożony - bardziej niż nam się wydaje - więc tworzenie oprogramowania, które uwzględnia wszystkie jego niuanse i skutecznie określa ludzkie intencje stojące za tym językiem, jest również złożone. Ale podobnie jak w przypadku ludzkiej inteligencji, wystarczające szkolenie sztucznej inteligencji umożliwia maszynie przezwyciężenie tych złożoności (jeśli dane szkoleniowe są wystarczająco dobrze ukształtowane).

Szkolenie AI ma specyficzne wymagania, unikalne dla każdego zastosowania i kontekstu AI. Załóżmy na przykład, że zamierzamy wytrenować chatbota wykorzystującego NLU do pracy w dziale obsługi klienta w zakresie podróży lotniczych. Chatbot będzie przetwarzał naturalny język klientów, aby pomóc im zarezerwować loty i dostosować ich trasy.

W takim przypadku twórca chatbota musi dostarczyć algorytmowi języka naturalnego maszyny dane dotyczące intencji. Dane te składają się z typowych fraz, których klienci mogą używać do tworzenia lub zmiany rezerwacji. Algorytm języka naturalnego - funkcja uczenia maszynowego - trenuje się na danych, dzięki czemu asystent konwersacyjny może rozpoznawać frazy o podobnym znaczeniu, ale różnych słowach.

W idealnej sytuacji szkolenie to przygotuje asystenta konwersacyjnego do obsługi większości scenariuszy dla klientów, uwalniając ludzkich agentów od żmudnych połączeń, w których głębsze ludzkie zdolności nie są wymagane. W międzyczasie asystent konwersacyjny może odroczyć bardziej złożone scenariusze do ludzkich agentów (np. rozmowy wymagające ludzkiej empatii). Nawet przy tych możliwościach programiści muszą nadal dostarczać algorytmowi różnorodne dane, aby mógł on skalibrować swój wewnętrzny model, aby dotrzymać kroku zmianom w zachowaniach klientów i potrzebach biznesowych.

W tym celu metoda zwana wektoryzacją słów mapuje słowa lub frazy na odpowiadające im "wektory" - liczby rzeczywiste, których maszyny mogą używać do przewidywania wyników, identyfikowania podobieństw słów i lepszego rozumienia semantyki. Wektoryzacja słów znacznie rozszerza zdolność maszyny do rozumienia języka naturalnego, co stanowi przykład postępowego charakteru i przyszłego potencjału tych technologii.

Wskazówki dotyczące tworzenia zbioru danych