A Google apresentou nesta quarta-feira (6) o que considera ser o seu modelo de inteligência artificial (IA) da próxima geração, o Gemini, descrito como o modelo mais flexível da empresa até agora, capaz de funcionar “com eficiência” em tudo, desde data centers até dispositivos móveis.
Em um comunicado conjunto, assinado pelo CEO da Google e Alphabet, Sundar Pichai, e pelo CEO da DeepMind, Demis Hassabis, os executivos defendem que os recursos do Gemini, que são de última geração, melhorarão significativamente a forma como os desenvolvedores e clientes empresariais constroem e escalam com a IA.
“Gemini é o resultado de esforços colaborativos em grande escala entre equipas do Google, incluindo os nossos colegas do Google Research. Foi construído desde o início para ser multimodal, o que significa que pode generalizar e compreender, operar e combinar diferentes tipos de informação, incluindo texto, código, áudio, imagem e vídeo”, destaca Demis Hassabis.
Introducing Gemini 1.0, our most capable and general AI model yet. Built natively to be multimodal, it’s the first step in our Gemini-era of models. Gemini is optimized in three sizes – Ultra, Pro, and Nano
— Sundar Pichai (@sundarpichai) December 6, 2023
Gemini Ultra’s performance exceeds current state-of-the-art results on… pic.twitter.com/pzIw6iCPPN
Ao contrário dos modelos tradicionais que treinam componentes separados para diferentes modalidades e depois os combinam, o Gemini foi projectado para ser nativamente multimodal. Foi pré-treinado desde o início em diversas modalidades e depois aperfeiçoado com dados multimodais adicionais para aumentar a sua eficácia. Esta abordagem diferencia o Gemini dos seus concorrentes, como o GPT-4 da OpenAI.
“Isso ajuda o Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o início, muito melhor do que os modelos multimodais existentes – e as suas capacidades são de última geração em quase todos os domínios”, sublinha Demis Hassabis.
Espera-se que o Gemini seja o modelo de IA mais poderoso já construído, ostentando capacidades multimodais sofisticadas que lhe permitem dominar conversas, linguagem e conteúdo de estilo humano, bem como compreender e interpretar imagens, codificar de forma prolífica e eficaz, gerar dados e análises e ser utilizado por desenvolvedores para criar novos aplicativos e APIs de IA.
Gemini Pro em produtos da Google
Na sequência do lançamento do Gemini, a Google introduziu no chatbot Bard uma versão aprimorada do Gemini Pro, para melhorar o raciocínio, planeamento e compreensão da ferramenta, entre outras valências. Esta é a maior actualização do Bard desde o seu lançamento. A actualização estará disponível em inglês em mais de 170 países e territórios, incluindo Angola.
A Google também integrou o Gemini no seu telemóvel Pixel, precisamente o modelo Pixel 8 Pro, tornando-o o primeiro telemóvel projectado para suportar o Gemini Nano, que está a potencializar novos recursos como o Summarize no aplicativo Recorder e o Smart Reply no Gboard.
A empresa promete que nos próximos meses o Gemini estará disponível em mais produtos e serviços a Google, tais como Pesquisa, Anúncios, Chrome e Duet AI.