Úvod do umělé inteligence (AI) a velkých jazykových modelů (LLM) - (Díl 1)
Úvod do umělé inteligence (AI) a velkých jazykových modelů (LLM)- (Díl 1)
Umělá inteligence (AI), definovaná jako schopnost počítačových systémů vykonávat úkoly, které obvykle vyžadují lidskou inteligenci, se stala klíčovou oblastí růstu. Přitahuje významné investice a vytváří četné pracovní příležitosti. Její aplikace sahají od lékařské diagnostiky a autonomních vozidel po každodenní úkoly, jako jsou doporučení videí. AI systémy fungují tak, že analyzují historická data a identifikují vzory, čímž zlepšují procesy rozhodování. Například AI v obchodě prodávajícím deštníky může objednávat zásoby na základě předpovědi počasí.
Pokroky v AI za poslední dekádu byly poháněny dostupností velkých datových sad, zlepšením výpočetního výkonu – především díky lepší reprezentaci čísel, efektivnějšímu přístupu do paměti, menším čipům – a zdokonalením algoritmů strojového učení. Výkon GPU se za posledních 10 let zvýšil tisíckrát (1).
Generativní umělá inteligence a velké jazykové modely (LLM)
Generativní umělá inteligence zahrnuje systémy schopné vytvářet nový obsah, jako jsou texty, obrázky nebo hudba. Příkladem je ChatGPT od OpenAI, který je poháněn velkým jazykovým modelem (LLM), což je podkategorie foundation modelů. Tyto modely jsou trénovány na obrovském množství nestrukturovaných dat, což jim umožňuje učit se vzorů a generovat nový obsah. Termín „foundation models“ jako takový zavedl tým ze Stanfordu (2), který zároveň předpověděl jejich široké využití.
Foundation modely umožňují přenos znalostí mezi úkoly (tasks) a díky ladění (tuning) dokážou případně vykonávat řadu dalších úkolů s minimem nových dat. Navzdory svému výkonu mají své omezení, například vysoké výpočetní náklady a problémy s důvěryhodností výstupu. Tradiční modely strojového učení naopak vyžadují velké množství označených dat a jsou specifické pro daný úkol, což činí vývoj a aplikaci nových řešení časově náročným a nákladným (2).
Pokrok v oblasti zpracování přirozeného jazyka a multimodální AI
Průlom v zpracování přirozeného jazyka nastal s vynálezem Transformer Language Models v roce 2017 (3). Tyto modely umožnily výrazně zlepšit schopnost zpracování jazyka a jsou použitelné pro širokou škálu úkolů, čímž položily základy pro vznik velkých jazykových modelů (LLMs). Velké jazykové modely (LLMs) excelují ve třech hlavních oblastech: extrakci informací, klasifikaci a generování textu. V těchto oblastech jsou používány pro efektivní a přesné získávání dat, kategorizaci a tvorbu textů.
OpenAI je známá svými pokročilými modely ChatGPT, které byly spuštěny na konci roku 2022 (4). Nedávno představený GPT-4o (Omni) představuje významný pokrok v multimodální AI, schopný zpracovávat a generovat výstupy napříč různými modalitami, včetně textu, audia, obrazu a videa. S dobou odezvy pouhých 232 milisekund pro zvukové vstupy se přibližuje rychlosti lidského rozhovoru (5). Existuje také menší a nákladově efektivnější verze s názvem GPT-4o mini (6).
Omezení a budoucí vývoj umělé inteligence
Je důležité si uvědomit, že i když jsou tyto technologie užitečné, stále jsou to jen algoritmy. Algoritmy se učí z historických dat a mohou selhat při setkání s novými daty. Například v medicínské aplikaci strojového vidění umělá inteligence pověřená identifikací zlomeniny na lidské páteři vůbec nepoznala, že místo lidské páteře jí byl poskytnut obraz rybího skeletu, a halucinovala zdánlivě správný výsledek. To vše proto, že takový scénář nebyl zahrnut v trénovacích datech.
Konečným cílem iniciativ v oblasti umělé inteligence, včetně OpenAI, je dosáhnout AGI (Obecné umělé inteligence), tedy AI schopné vykonávat jakýkoli intelektuální úkol, který zvládne člověk. Podle článku Google DeepMind (7) lze AGI definovat jako technologii, která se postupně vyvíjí od pokroků ve specifických oblastech, jako je rozpoznávání textu nebo tvorba obrazů (kde již dnes může AI člověka překonat), až po schopnost samostatně fungovat v širokém spektru oblastí (obecné schopnosti). AGI má tedy potenciál nejen zásadně proměnit medicínu, ale i zcela změnit svět. Přesto pokrok směrem k AGI v oblasti obecných schopností stále vyžaduje mnoho zlepšení a výzkumníci čelí řadě výzev, které je nutné překonat.