Codificação por Pares de Bytes - Codificação por pares de bytes é um algoritmo de tokenização de subpalavras que evita o vocabulário fixo, combinando iterativamente os pares de símbolos adjacentes mais frequentes.

Nenhum registro encontrado.