A Apple está se destacando no ramo da inteligência artificial e acaba de apresentar uma nova linha de LLM (grande modelo de linguagem) de código aberto.
O nome desse novo projeto é OpenELM. E durante os testes, ele obteve resultados tão bons quanto outros modelos de linguagem abertos, mas com menos tempo de treinamento.
O OpenELM consiste em uma família de modelos de linguagem acessíveis e . A Apple explicou que ele adota uma estratégia inteligente para distribuir os parâmetros dentro do modelo, resultando em maior precisão nas análises.
Como o OpenELM da Apple funciona?
Por exemplo, com um investimento de cerca de um bilhão, o OpenELM conseguiu aumentar a precisão em 2,36% em comparação com um outro modelo chamado OLMo. E o mais interessante é que ele utilizou apenas a metade dos tokens de pré-treinamento necessários. Para ilustrar melhor, o Phi 3 Mini da Microsoft é um modelo mais compacto que opera com 3,8 bilhões de parâmetros.
A abordagem da Apple está sendo inovadora desta vez. Ao invés de apenas disponibilizar o código para inferência e pré-treinamento em conjuntos de dados privados, a empresa está indo além.
Leia também:
O lançamento do OpenELM inclui toda a estrutura necessária para treinar e avaliar o modelo em conjuntos de dados disponíveis publicamente.
E existe também programação para transformar os modelos para a biblioteca MLX, utilizada para inferência e ajuste personalizado em dispositivos da Apple. Tudo isso contribui para o crescimento da comunidade de pesquisa aberta.
Quando a IA da Apple deve ser lançada?
E em relação à Apple, o evento mais aguardado do ano, o WWDC 24, está se aproximando em junho. Há rumores de que a Apple finalmente irá revelar sua própria inteligência artificial no iOS 18.
Leia também:
Assim que tivermos mais informações sobre o mundo da inteligência artificial, vamos te informar nas redes sociais do CanalJMS. Por isso, é importante que você nos siga no Instagram e acompanhe nosso canal no YouTube, além de acompanhar nossos posts diários por aqui também!