Bitget App
Trading inteligente
Comprar criptoMercadosTradingFuturosRendaCentralMais
Tether Data expande QVAC Genesis II para 148 bilhões de tokens de IA

Tether Data expande QVAC Genesis II para 148 bilhões de tokens de IA

CryptotaleCryptotale2025/12/23 08:44
Mostrar original
Por:Cryptotale
  • QVAC Genesis II expande o treinamento de IA aberta para 148 bilhões de tokens em 19 áreas acadêmicas.
  • O conjunto de dados treina modelos para explicar escolhas e aprimorar o raciocínio além da superfície .
  • Tether Data libera o conjunto de dados abertamente para apoiar pesquisadores fora de sistemas de IA fechados.

A Tether Data lançou o QVAC Genesis II, expandindo seu conjunto de dados educacionais sintéticos abertos para inteligência artificial para 148 bilhões de tokens em 19 domínios acadêmicos. A atualização adiciona 107 bilhões de tokens ao lançamento anterior, Genesis I, posicionando o conjunto de dados como o maior recurso educacional sintético disponível publicamente no mundo para pré-treinamento de IA.

QVAC, a divisão de pesquisa em inteligência artificial da Tether Data, afirmou que o conjunto de dados tem como objetivo fortalecer o raciocínio, a explicação e a tomada de decisões em modelos de IA, em vez de apenas o aprendizado de padrões superficiais. O lançamento ocorre enquanto muitos conjuntos de dados avançados de treinamento permanecem restritos a sistemas proprietários, limitando o acesso para pesquisadores independentes e instituições acadêmicas.

Escala do Conjunto de Dados e Cobertura Acadêmica

O conjunto de dados expandido abrange 19 domínios acadêmicos e foca na profundidade do raciocínio educacional em tarefas estruturadas de raciocínio. A QVAC afirmou que o aumento de escala apoia treinamentos mais consistentes para modelos que exigem saídas baseadas em explicação, e não apenas previsão probabilística de texto.

Como resultado, o conjunto de dados prioriza clareza e causalidade nas perguntas e respostas utilizadas durante o pré-treinamento. O conjunto de dados permanece disponível abertamente para pesquisadores, universidades e desenvolvedores independentes que trabalham fora de plataformas fechadas.

Tether Releases QVAC Genesis II, Expanding the World’s Largest Synthetic Educational Dataset to 148 Billion Tokens

Follow @qvac_tether and read more:https://t.co/FhKgwZEKCr

— Tether (@Tether_to) 22 de dezembro de 2025

A QVAC lançou o Genesis II sob a licença Creative Commons Attribution–NonCommercial 4.0, continuando a abordagem de licenciamento usada no Genesis I. A organização afirmou que a licença apoia o uso para pesquisa, preservando os limites de atribuição e não comercial. O conjunto de dados e os modelos relacionados estão disponíveis através do Hugging Face, juntamente com documentação detalhada e ferramentas de acesso.

Novo Método de Raciocínio em Nível de Opção

No centro do Genesis II está um novo método de geração de dados chamado Raciocínio em Nível de Opção. O método avalia cada alternativa em uma questão de múltipla escolha, incluindo opções corretas e equívocos comuns.

Em vez de tratar as respostas corretas como saídas finais, a abordagem examina por que cada opção é bem-sucedida ou falha. A QVAC afirmou que esse processo reforça o raciocínio válido enquanto aborda diretamente suposições incorretas nos dados de treinamento.

O método se baseia na estrutura de análise de falhas introduzida no Genesis I. Juntos, ambos os métodos formam um pipeline de dupla abordagem que garante que cada item gerado contribua com valor instrucional.

Avaliações independentes citadas pela QVAC mostram que modelos treinados com dados do Genesis II alcançam maior precisão de raciocínio e fornecem respostas mais claras de forma consistente. Como resultado, o conjunto de dados direciona o foco do treinamento para a compreensão estruturada, e não apenas para a fluência.

Relacionado: Tether Submete Proposta para Adquirir o Juventus Football Club

Pesquisa Aberta e Objetivos de IA Descentralizada

A QVAC afirmou que o lançamento está alinhado com seu esforço mais amplo de apoiar o desenvolvimento local e descentralizado de IA. A iniciativa busca permitir o treinamento e a implantação de modelos sem depender de plataformas de nuvem centralizadas.

Ao expandir as bases de treinamento abertas, a Tether Data visa eliminar barreiras estruturais enfrentadas por grupos de pesquisa menores. “A maioria dos treinamentos de IA hoje otimiza para fluência, não para compreensão”, disse Paolo Ardoino, CEO da Tether.

“Com este lançamento, estamos indo além do volume em direção à estrutura, raciocínio e clareza”, disse Ardoino. Ele acrescentou que o acesso aberto oferece aos pesquisadores ferramentas para desenvolver sistemas de IA que permanecem explicáveis e confiáveis.

O artigo técnico, intitulado QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training, está disponível no blog de pesquisa da QVAC. A QVAC também publicou uma FAQ detalhada e materiais de apoio em seu site oficial.

À medida que os sistemas de IA se expandem para educação, ciência e serviços financeiros, incluindo aplicações fintech, será que conjuntos de dados estruturados podem remodelar como sistemas inteligentes aprendem e operam?

0
0

Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.

PoolX: bloqueie e ganhe!
Até 10% de APR - Quanto mais você bloquear, mais poderá ganhar.
Bloquear agora!
© 2025 Bitget