Spaudos centras

Naujos kartos „Gemini 3“ – didžiausias „Google“ dirbtinio intelekto šuolis iki šiol

Dr. Mantas Lukauskas, Kauno technologijos universiteto Matematikos ir gamtos mokslų fakulteto (KTU MGMF) mokslininkas ir „Hostinger“ dirbtinio intelekto techninis grupės vadovas

Dar 2017 m. „Google“ tyrėjų komanda padėjo pamatus šiuolaikinei dirbtinio intelekto (DI) revoliucijai, pristatydama transformerių architektūrą (angl. transformer architecture). Būtent ši technologija vėliau tapo pagrindu tokiems modeliams kaip GPT. Vis dėlto pastaraisiais metais „Google“ atsidūrė besivejančiojo vaidmenyje – konkurentai, pavyzdžiui, „OpenAI“ ir „ChatGPT“, pristatė pažangesnius DI modelius plačiajai visuomenei.

Dėl vidinių iššūkių „Google“ kiek sulėtino tempą. Nors ji ir buvo DI inovacijų pradininkė, savo tyrimus paversti masiškai naudojamais produktais sekėsi sunkiau. Tuo metu drąsesni rinkos žaidėjai sparčiai žengė į priekį ir greitai pritraukė visuomenės dėmesį.

Tačiau naujausi „Google“ žingsniai rodo, kad bendrovė ryžtingai siekia susigrąžinti lyderystę. 2025 m. lapkričio 18 d. pristatytas „Gemini 3“ – pažangiausias kada nors „Google“ sukurtas DI modelis – žymi naują etapą, kuriame sujungiamos visos ankstesnių modelių stiprybės ir pristatoma gausybė naujų galimybių.

Rekordinis samprotavimo gebėjimas

„Google“ pabrėžia, kad naujasis „Gemini 3“ išsiskiria itin stipriu samprotavimu – tai matyti ir praktikoje. Į „Google Search“ integruota „Gemini“ versija geba suprasti užuominas ir tiksliau interpretuoti sudėtingas užklausas.

Modelis nuo pat pradžių kurtas kaip daugiarūšis, todėl natūraliai apdoroja tekstą, vaizdus, garso įrašus, programinį kodą ir kitus duomenų tipus. Jis gali vienu metu įvertinti kelis skirtingus šaltinius – pavyzdžiui, PDF dokumentą, susijusį paveikslėlį, garso klipą ir kodo fragmentus – ir sujungti juos į vieną nuoseklų atsakymą.

Nors „Gemini 3“ išlaiko įspūdingą maždaug 1 milijono tokenų (angl. tokens) konteksto langą – tai daugiau nei keturių milijonų ženklų talpa – tikrasis šio modelio proveržis slypi ne dydyje. Svarbiausia naujovė ta, kad modelis ne tik perskaito tokį milžinišką informacijos kiekį, bet ir geba jį giliai suprasti: susieti faktus, atlikti sudėtingas logines išvadas ir išlaikyti nuoseklų mąstymą visame ilgame tekste. Ankstesni modeliai galėjo apdoroti didelius duomenų kiekius, tačiau dažnai prarasdavo esmę ar ryšius tarp tolimų teksto dalių. „Gemini 3“ šią ribą peržengia, todėl didelis konteksto langas tampa ne tik talpa, bet ir realų pranašumą suteikiančiu veikimo būdu.

Nors modelis neveikia savarankiškai, prijungtas prie įrankių ar aplikacijų programavimo sąsajų (angl. Application Programming Interface, API) jis įgyja agentui būdingų savybių. Tokiu atveju „Gemini 3“ gali suprasti, kada užduočiai reikia papildomos informacijos, suformuluoti tikslingą paieškos užklausą, pasinaudoti jam suteiktais įrankiais – paieška, kodo vykdymu ar dokumentų analize – ir gautus duomenis sujungti į nuoseklų galutinį atsakymą.

Tai reiškia, kad „Gemini 3“ išplečia paiešką pagal vartotojo ketinimą ir surenka platesnį faktinių šaltinių rinkinį. Svarbu pažymėti, kad modelis pats savaime nevykdo veiksmų realiame pasaulyje, tačiau tampa itin pajėgiu agentu tada, kai yra integruojamas į valdomą aplinką – pavyzdžiui, „Search“, „Workspace“ ar įvairias kūrimo platformas.

„Deep Think“ režimas – vienas stipriausių

„Gemini 3“ itin sustiprėjo programavimo užduotyse. Modelis gali ne tik parašyti kodą, bet ir sukurti veikiančias sąsajas, generuoti grafinius elementus ar integruoti logiką. Vartotojo idėja – nuo aprašymo iki veikiančio prototipo – dabar virsta gerokai trumpesniu ir sklandesniu procesu.

„Gemini 3“ taip pat patobulintas kaip modelis, gebantis išlaikyti ilgalaikį planą ir nepasimesti tarp tarpinių žingsnių. Tai patvirtina ir „Vending-Bench 2“ – metų trukmės verslo valdymo simuliacija, kurioje modelis nuosekliai planavo, stebėjo metrikas ir viso proceso metu priėmė pagrįstus sprendimus. Praktikoje tai reiškia, kad „Gemini 3“ gali atsakingai planuoti procesus – nuo projektų struktūravimo iki detalaus užduočių išskaidymo – ir išlaikyti aiškią darbo kryptį net sudėtingose situacijose.

Kartu su „Gemini 3“ pristatytas „Giliojo mąstymo“ (angl. Deep Think) režimas, skirtas itin sudėtingoms ir abstrakčioms problemoms spręsti. Šis režimas leidžia modeliui skirti daugiau laiko samprotavimui, išbandyti daugiau tarpinių strategijų ir pateikti gilesnę analizę.

„Gemini 3“ pasiekimai įvairiuose etaloniniuose testuose patvirtina šių patobulinimų realumą. „Google“ atliko plataus masto palyginimą, kuriame „Gemini 3 Pro“ varžėsi su kitais pažangiausiais modeliais – tarp jų „OpenAI GPT-5.1“ ir „Anthropic Claude Sonnet 4.5“ – net 20 skirtingų užduočių rinkiniuose.

Rezultatai įspūdingi: „Gemini 3 Pro“ surinko aukščiausius balus 19 iš 20 testų ir dominavo 95 proc. vertinimų. Tai aiškiai rodo, kad naujasis „Google“ modelis šiuo metu yra vienas stipriausių pasaulyje pagal platų gebėjimų spektrą.

Kai kuriose srityse pranašumas ypač ryškus. Pavyzdžiui, „paskutiniojo žmonijos egzamino“ simuliacijoje (angl. Humanity’s Last Exam), kur vertinamas ekspertinis žinių lygis ir kurio užduotis paprastiems žmonėms įveikti būtų itin sunku, „Gemini 3 Pro“ surinko net 11 procentinių punktų daugiau nei artimiausias konkurentas GPT-5.1 (atitinkamai 37,5 proc. prieš 26,5 proc.). Faktinių žinių tikslumo rungtyje (angl. SimpleQA Verified) „Gemini 3“ net 40 proc. lenkė konkurentus: pasiekė apie 72 proc. tikslumą, kai kiti modeliai svyravo ties 30–55 proc. riba.

Tokie skirtumai leidžia teigti, kad šiuo metu „Google“ pagal DI modelių pajėgumą yra aiškiai išsiveržusi į priekį. Žinoma, verta pažymėti, kad „Gemini 3“ yra labai naujas ir itin sudėtingas modelis, todėl jo pranašumai realiame pasaulyje vartotojams atsiskleis palaipsniui, augant pritaikymui ir kaupiantis praktinei patirčiai.

Ne tik tekstiniai atsakymai

Viena stipriausių „Gemini 3“ pusių – plati integracija į „Google“ produktus ir sparčiai augančią įrankių ekosistemą. „Google“ nuo pat pirmos dienos pradėjo naudoti šį modelį savo vartotojiškose paslaugose.

„Google Search“ atsirado vadinamasis DI režimas (angl. AI Mode), kuriame integruotas „Gemini 3 Pro“. JAV vartotojai, turintys „Google AI Pro“ ar „Ultra“ prenumeratą, jau gali rinktis „Gemini 3“ kaip paieškos variklį sudėtingesnėms užklausoms spręsti. Tai suteikia paieškai visiškai naujų galimybių: sudėtingiems klausimams pateikiami ne tik tekstiniai atsakymai, bet ir dinaminiai vizualūs išdėstymai, interaktyvios diagramos, mini simuliacijos, pritaikytos konkrečiai užklausai.

Pavyzdžiui, ieškant paaiškinimo apie sudėtingą fizikos reiškinį, „Gemini 3“ gali sugeneruoti interaktyvų modelį ar vizualizaciją, kuri padeda geriau suprasti atsakymą. Tai iš esmės nauja patirtis, transformuojanti tradicinę paiešką į mokomąją ir tyrinėjimo platformą.

„Gemini 3“ taip pat prieinamas per atskirą „Gemini“ programėlę. Joje vartotojai gali užduoti klausimus, pateikti kūrybines užduotis ar net patikėti agentui atlikti tam tikrus veiksmus. „Google AI Ultra“ plano naudotojai jau turi prieigą prie specialios „Gemini Agent“ funkcijos – interaktyvaus agento, galinčio padėti kasdienėse veiklose, pavyzdžiui, tvarkant el. paštą. Demonstracijose matyti, kaip „Gemini Agent“ automatiškai surūšiuoja „Gmail“ laiškus pagal vartotojo nurodymus.

Svarbu tai, kad toks agentas veikia „su vartotojo priežiūra“: DI atlieka daug darbo, tačiau esminiams veiksmams paprašo patvirtinimo, taip išlaikydamas žmogaus kontrolę. Tai didina pasitikėjimą – naudotojas jaučiasi ne paleidžiantis nekontroliuojamą algoritmą, o deleguojantis užduotį patikimam komandos nariui.

Žinoma, toks aukšto lygio modelis reikalauja ir didesnių resursų – pabrėžiama, kad „Gemini 3“ naudojimas brangesnis nei daugelio kitų modelių, tačiau kartu jis pasižymi greitesniu atsako laiku, nepaisant didžiulės skaičiavimo galios. Tai rodo, kad „Google“ orientuoja „Gemini 3“ į profesionalius naudojimo atvejus, kuriuose kokybė ir galimybės svarbesnės už vien tik ekonomiškumą.

Konkurencija nesustoja

„Gemini 3“ pasirodymas neabejotinai tapo vienu laukiamiausių įvykių DI srityje nuo pat GPT-4 ar GPT-5 pristatymų. Dar iki išleidimo šis modelis buvo vadinamas pagrindiniu „Google“ koziriu prieš „OpenAI“ ir kitus konkurentus, ir, sprendžiant iš pirmųjų rezultatų, lūkesčiai pasitvirtino.

Žinoma, konkurencija nesustoja. Modelių kūrimas tapo savotiškomis ginklavimosi varžybomis, kur kiekvienas naujas didelis modelis siekia pranokti ankstesnį. „OpenAI“, „Anthropic“, „Meta“ ir kiti tyrimų centrai taip pat sparčiai tobulina savo modelius. Tačiau „Gemini 3“ rodo, kad „Google“ nusiteikusi investuoti ir diegti inovacijas visapusiškai.

„Gemini 3“ debiutas įdomus ir moralinės atsakomybės požiūriu. „Google“ viešai pabrėžia, kad modelis kurtas laikantis atsakingo DI principų – optimizuojant ne tik sumanumą, bet ir saugumą, atsakymų tikslumą, šališkumo mažinimą ir kt. Ankstesnės nesėkmės (pvz., netikslus „Bard“ atsakymas per pristatymą, kainavęs reputaciją) išmokė bendrovę itin atidžiai vertinti modelių kokybę prieš juos plačiai diegiant.

Dėl to „Gemini 3“ startuoja palaipsniui: iš pradžių jis prieinamas išplėstinių planų naudotojams ir kūrėjams per API, o vėliau planuojama prieinamumą plėsti visiems. Tikėtina, kad artimiausiu metu vis daugiau žmonių, net ir nemokančių už „Pro“ planus, patirs netiesioginę naudą – pavyzdžiui, pagerėjusius paieškos rezultatus ar sumanesnes „Google“ asistento funkcijas, veikiančias „užkulisiuose“ su „Gemini 3“.

Drąsiai galima teigti, kad su „Gemini 3“ pasirodymu DI varžybos įgauna naują pagreitį – ir iš to laimi visi technologijų naudotojai, kurie netrukus patys galės išbandyti šio pažangaus modelio galimybes.

Pranešimą paskelbė: Mantas Lapinskas, Kauno technologijos universitetas
„BNS Spaudos centre“ skelbiami įvairių organizacijų pranešimai žiniasklaidai. Už pranešimų turinį atsako juos paskelbę asmenys bei jų atstovaujamos organizacijos.
2025-11-19 16:15
Švietimas ir mokslas ITT Verslas, ekonomika, finansai
Kontaktinis asmuo
Mantas Lapinskas
Ekspertinės komunikacijos vadovas / Atstovas žiniasklaidai
Kauno technologijos universitetas
+370 626 59136
mantas.lapinskas@ktu.lt
logo
Prisegti failai