Google Gemma 3n na versão final com melhorias

O Google anunciou a disponibilidade da versão final do Gemma 3n . O modelo de código aberto, lançado em versão prévia no final de maio , pode ser executado localmente em dispositivos graças ao seu tamanho compacto. Portanto, é um concorrente direto dos modelos Phi-4 da Microsoft.
Recursos avançados do Google Gemma 3nO Gemma 3n pode ser chamado de versão de código aberto do Gemini Nano, pois compartilha a mesma arquitetura básica. O modelo é derivado do Gemma 3, mas tem dimensões menores, permitindo que seja executado diretamente em smartphones, tablets e notebooks.
O Gemma 3n é oferecido em duas versões: E2B e E4B (E significa Efetivo). O número real de parâmetros é de 5 e 8 bilhões, respectivamente. No entanto, o Google DeepMind desenvolveu a tecnologia Per-Layer Embeddings (PLE) que reduz drasticamente o uso de RAM, tornando os modelos comparáveis aos modelos com 2 e 4 bilhões de parâmetros, daí os nomes E2B e E4B.
O Gemma 3n é multimodal. Além de texto, ele pode compreender e processar imagens, áudio e vídeo . Graças às melhorias implementadas pela empresa de Mountain View, ele suporta 140 idiomas para texto e 35 idiomas para conteúdo multimídia. Os recursos incluem transcrição de áudio e tradução em tempo real. Também oferece excelentes recursos em matemática, programação e raciocínio.
A versão E4B da Gemma 3n é o primeiro modelo com menos de 10 bilhões de parâmetros a ultrapassar a marca de 1.300 no benchmark LMArena Elo. A Gemma 3n está disponível no Google AI Studio e em outras ferramentas de desenvolvimento. Ela pode ser baixada pelo Kaggle e pelo Hugging Face.
Punto Informatico