Na quarta-feira (6), o Google revelou o lançamento da sua mais recente ferramenta, focada em inteligência artificial, chamado Gemini. Essa nova tecnologia além de multifuncional, vem incorporada ao Bard e tem a capacidade de ensinar matemática e criar códigos de programação.
Além disso, ela será integrada nativamente ao sistema operacional Android e estará disponível na função de busca a partir de 2024.
A partir de agora, os usuários que acessam o Bard em inglês terão acesso a uma tecnologia mais avançada e capaz de realizar várias formas de interação. Sundar Pichai, CEO do Google, descreveu o lançamento como “o nosso modelo mais poderoso e versátil até agora, com um desempenho de última geração em muitos testes de vanguarda”.
Como funciona o Gemini?
Usando como exemplo, o ChatGPT é um chatbot que oferece respostas às perguntas feitas pelos usuários. Por outro lado, o Gemini, segundo o Google, representa um progresso notável na maneira como a inteligência artificial pode contribuir para aprimorar o dia a dia. Nesse sentido, ele consegue compreender, resumir, operar e unir diversos tipos de informações.
Em poucas palavras, modelo fundacional é a tecnologia que forma a base para o funcionamento de uma inteligência artificial generativa. Essa tecnologia recebe comandos de seus usuários, sejam eles em formato de texto ou não.
Os modelos são treinados com conteúdo diversificado e operados por redes neurais complexas. O Gemini foi treinado usando os modelos v4 e V5e dos chips TPU, desenvolvidos pela Google. Além disso, a empresa lançou os novos TPU v5p.
Nano, Pro e Ultra
De acordo com o Google, haverá três opções de dimensão para o novo modelo, permitindo que ele seja compatível com uma variedade de dispositivos, desde centros de dados até aparelhos móveis.
Sendo eles:
- Nano: uma versão básica que se concentra na eficiência e opera localmente em um smartphone ou tablet – estará disponível em dispositivos Android, começando pelo Pixel 8 Pro;
- Pro: uma versão expandida e padrão da tecnologia para serviços conectados à internet, como o Bard e potencialmente o Busca e Chrome no futuro;
- Ultra: a versão suprema, com um conjunto de parâmetros maior e mais eficiente para lidar com tarefas altamente complexas, de acordo com o Google – será utilizado no serviço Bard Advance.
IA multimodal
O modelo recente é uma IA multimodal, o que significa que possui a capacidade de interagir por meio de voz, vídeo, texto, imagem e códigos. Além disso, oferece recursos avançados para solucionar problemas matemáticos.
Inclusive, o planejamento inicial contava com várias modalidades diferentes, o que é incomum na indústria. Normalmente, as capacidades são desenvolvidas separadamente para cada tipo de conteúdo e integradas posteriormente em um único sistema.
Para ficar sabendo mais sobre as inteligências artificiais e tudo sobre o mundo da tecnologia, siga o @canaljms nas redes sociais, pois sempre estamos atualizando as novidades por lá, em primeira mão!