Na świecie rośnie popularność sztucznej inteligencji. W rozwoju tej technologii przodują Amerykanie, ale swój kawałek tortu chcą mieć również Europejczycy. Dlatego, jak pisze Politico, „kraje od Hiszpanii po Rumunię inwestują w tworzenie chatbotów posługujących się narodowymi językami”. Z tyłu nie chce zostać również Polska.

"Tylko w ubiegłym roku 13 państw europejskich ogłosiło lub podjęło kroki w celu opracowania modeli opartych na narodowych językach" - czytamy w Politico.

Czym są owe modele? To rodzaj zaawansowanego algorytmu sztucznej inteligencji. Duże modele językowe (LLM - Large Language Model) specjalizują się w przetwarzaniu języka naturalnego. Potrafią m.in. generować i tłumaczyć teksty. Ze stworzonymi na ich podstawie tzw. chatbotami można prowadzić rozmowy. Tworzenie LLM to dziś główny kierunek w rozwoju sztucznej inteligencji. Przodują w tym firmy z USA, przede wszystkim ChatGPT autorstwa OpenAI, Gemini opracowany przez Google, Claude firmy Anthropic oraz Meta i xAI Elona Muska.

"Mark Twain nie powinien przesłaniać Stendhala" - powiedział w lutym francuski minister gospodarki i finansów Bruno Le Maire. Polityk wyraził obawę, że status języka francuskiego może zostać osłabiony przez algorytmy i systemy sztucznej inteligencji oparte na języku angielskim.

Europa chce rozwijać nowoczesną technologię, ale jak stwierdza Politico, używanie 24 języków na terenie Unii może stanowić poważny problem. "Mieszkańcy Starego Kontynentu boją się możliwej dominacji amerykańskich firm, tak jak w przypadku mediów społecznościowych i Web 2.0. (idei, że to sami użytkownicy tworzą, zmieniają i udostępniają treści w internecie - przyp. red.)" - podaje Politico. Problemem jest m.in. skomplikowanie wielu języków europejskich, które w porównaniu do angielskiego, muszą oddawać niekiedy bardzo zniuansowane sformułowania. Nie bez przyczyny ponad połowa stron w internecie jest po angielsku.

Europejska odpowiedź

Politico informuje, że w ciągu ostatniego roku 13 krajów europejskich ogłosiło lub podjęło kroki w celu opracowania modeli opartych na narodowych językach. Wsparcie ma dotyczyć m.in. projektów akademickich, startupów i zespołów niezależnych programistów.

Portal wymienia m.in. polski wielki model językowy PLLum (Polish Large Language Universal Model). Ma on być trenowany głównie na treściach polskojęzycznych. PLLum działa od listopada 2023 r., a tworzy je sześć jednostek naukowych z obszaru sztucznej inteligencji i językoznawstwa: Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK (PIB NASK), Ośrodek Przetwarzania Informacji - Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN.

"Posiadanie modeli w lokalnym języku oznacza także zachęcanie większej liczby osób w twoim kraju do kodowania i opracowywania większej liczby produktów AI (sztucznej inteligencji - przyp. red.)" - powiedział Carlos Romero Duplá, były hiszpański dyplomata, który negocjował unijne prawo dotyczące sztucznej inteligencji. Dla Hiszpanii rozwój sektora AI może oznaczać np. bliższą współpracę z krajami Ameryki Łacińskiej.

W lutym 2024 r. Komisja Europejska powołała konsorcjum Alt-EDIC (European Digital Infrastructure Consortium), którego celem jest współpraca w zakresie rozwoju LLM w językach europejskich. Polska jest jednym z 12 jego członków.