Puntos clave de la noticia:
- Chainbase lanza Theia-Llama-3.1-8B, un modelo de IA optimizado para investigaciones cripto avanzadas.
- El modelo se entrenó con datos de CoinMarketCap y reportes de investigación para garantizar precisión.
- Supera a varios modelos en benchmark cripto, destacándose en comprensión y generación de información.
Chainbase ha anunciado la apertura de su modelo de inteligencia artificial Theia-Llama-3.1-8B, una herramienta diseñada para investigaciones avanzadas en el campo cripto.
Este modelo, entrenado con un conjunto de datos especializado en proyectos blockchain, busca proporcionar a desarrolladores y científicos de datos un recurso eficiente y accesible para comprender y analizar el ecosistema cripto. El lanzamiento de esta versión tiene como objetivo fortalecer las capacidades de investigación del sector, facilitando la integración de análisis avanzados y predicciones en aplicaciones relacionadas con las criptomonedas.
We’ve just open-sourced Theia-Llama-3.1-8B, our crypto-focused language model trained on a carefully curated dataset from the blockchain domain.
The model outperforms other mainstream models with lower perplexity and higher BERT scores.
Read the full blog:… pic.twitter.com/OjA4yB5kCB
— Chainbase (✸,✸) (@ChainbaseHQ) October 11, 2024
El proceso de entrenamiento del modelo incluyó un conjunto de datos cuidadosamente seleccionado de dos fuentes principales: CoinMarketCap y reportes de investigación de fuentes confiables en internet.
El Valioso Aporte de CoinMarketCap
CoinMarketCap aportó información sobre los 2000 proyectos más importantes del mercado, basándose en su capitalización de mercado, mientras que los informes de investigación brindaron análisis profundos sobre el progreso de desarrollo y el impacto en el mercado de estos proyectos. Para garantizar la precisión y evitar redundancias, el conjunto de datos fue sometido a un riguroso proceso de filtrado, tanto manual como algorítmico.
Chainbase aplicó técnicas avanzadas de ajuste y optimización para mejorar el desempeño del modelo. Utilizando LoRA (Low-Rank Adaptation) para el ajuste del modelo base, la empresa pudo adaptar de manera eficiente su modelo preentrenado al dominio de las criptomonedas. Además, el uso de herramientas como DeepSpeed y LLaMA Factory permitió optimizar los recursos y acelerar el proceso de entrenamiento. Una característica fundamental es la cuantización del modelo en formato Q8, lo que redujo su tamaño y mejoró su rendimiento, haciéndolo más accesible para su implementación en dispositivos con recursos limitados, como GPUs de menor capacidad.
Chainbase Logra una Performance Inigualable
El desempeño del Theia-Llama-3.1-8B fue evaluado utilizando un benchmark desarrollado específicamente para modelos de IA en criptomonedas. Dicho análisis reveló que el modelo de Chainbase superó a varias alternativas en aspectos clave como la comprensión y generación de información cripto, posicionándose como una herramienta prometedora para la investigación blockchain.
Chainbase es una red de datos omnichain que integra información blockchain en un ecosistema unificado. Tiene todo lo necesario para seguir consolidándose como un referente en el uso de inteligencia artificial aplicada al mundo cripto, atrayendo a miles de desarrolladores y científicos de datos