Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Faculdade de Ciências da Universidade de Lisboa [1].
Ecossistema [2] de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B [3], e a família Gervásio (descodificadores) com o Gervásio 7B [4].
“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco [5], professor do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa [1], acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.
Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.
Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.
“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina [6], para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz António Branco.
Fonte: Faculdade de Ciências da Universidade de Lisboa [7]
Ligações
[1] https://ciencias.ulisboa.pt/
[2] https://huggingface.co/PORTULAN
[3] https://huggingface.co/PORTULAN/albertina-1b5-portuguese-ptpt-encoder
[4] https://huggingface.co/PORTULAN/gervasio-7b-portuguese-ptpt-decoder
[5] http://www.di.fc.ul.pt/~ahb/
[6] https://huggingface.co/portugueseNLP/medialbertina_pt-pt_900m
[7] https://ciencias.ulisboa.pt/pt/noticia/08-04-2024/ia-generativa-para-o-portugues-cresce-com-modelos-albertina-e-gervasio