Los modelos de lenguaje pequeño (SLM) se promocionan como el próximo gran avance en IA

Fuente Cryptopolitan

Si bien estas grandes tecnologías y otras están invirtiendo miles de millones de dólares enfocándose en desarrollar grandes LLM para manejar muchas tareas diferentes, la realidad de la IA es que no existe una solución única para todos, ya que se necesitan modelos de tareas específicas para las empresas.

Según Matt Garman, director ejecutivo de AWS, en un comunicado sobre su asociación e inversiones en expansión, ya existe una respuesta abrumadora de los clientes de AWS que están desarrollando IA generativa impulsada por Anthropic.

Para la mayoría de las empresas, los LLM siguen siendo la opción número uno para ciertos proyectos, pero para otras, esta opción puede resultar costosa en costo, energía y recursos informáticos.

Steven McMillan, dent y director ejecutivo de Teradata, que ha ofrecido un camino alternativo para algunas empresas, también tiene otras opiniones. Está seguro de que el futuro está en los SLM.

"Al mirar hacia el futuro, creemos que los modelos de lenguajes pequeños y medianos y los entornos controlados, como los LLM de dominios específicos, proporcionarán soluciones mucho mejores".

~ McMillan

Los SLM producen resultados personalizados sobre tipos específicos de datos, ya que los modelos de lenguaje están específicamente capacitados para hacerlo. Dado que los datos generados por los SLM se guardan internamente, los modelos de lenguaje se entrenan con datos potencialmente confidenciales.

Dado que los LLM consumen mucha energía, las versiones en idiomas pequeños están capacitadas para adaptar tanto la informática como el uso de energía a las necesidades reales del proyecto. Con tales ajustes, significa que los SLM son eficientes a un costo menor que los grandes modelos actuales.

Para los usuarios que quieran utilizar la IA para obtener conocimientos específicos, existe la opción de LLM de dominio específico, ya que no ofrecen conocimientos amplios. Está capacitado para comprender en profundidad solo una categoría de información y responder con mayor precisión, por ejemplo, un CMO frente a un CFO, en ese dominio.

Por qué los SLM son una opción preferida

Según la Asociación de Científicos de Datos (ADaSci), desarrollar completamente un SLM con 7 mil millones de parámetros para un millón de usuarios requeriría solo 55,1 MWh (megavatios hora).

ADaSci descubrió que entrenar GPT-3 con 175 mil millones de parámetros consumió aproximadamente 1.287 MWh de electricidad y la potencia no incluye cuando entre oficialmente en uso por parte del público. Por lo tanto, un SLM utiliza aproximadamente el 5% de la energía consumida durante la formación de un LLM.

Los modelos grandes generalmente se ejecutan en computadoras en la nube porque utilizan más potencia informática que la que jamás esté disponible en un dispositivo individual. Esto genera complicaciones para las empresas, ya que pierden el control sobre su información a medida que se traslada a la nube, y respuestas lentas a medida que viajan a través de Internet.

De cara al futuro, la adopción de la IA por parte de las empresas no será única para todos, ya que la prioridad será la eficiencia y la selección de la mejor y menos costosa herramienta para completar las tareas, lo que significa elegir el modelo del tamaño adecuado para cada proyecto.

Esto se hará para todos los modelos, ya sea un LLM de propósito general o LLM más pequeños y específicos de un dominio, según qué modelo ofrecerá mejores resultados, requerirá menos recursos y reducirá la necesidad de que los datos migren a la nube .

Para la siguiente fase, la IA será vital para las decisiones empresariales, ya que el público tiene una gran confianza en las respuestas generadas por la IA.

"Cuando se piensa en entrenar modelos de IA, estos deben construirse sobre la base de excelentes datos".

~ McMillan

"De eso se trata, de proporcionar ese conjunto de datos confiables y luego brindar las capacidades y capacidades analíticas para que los clientes y sus clientes puedan confiar en los resultados", agregó McMillan.

Dado que la eficiencia y la precisión tienen una gran demanda en el mundo, los LLM más pequeños y de dominios específicos ofrecen otra opción para brindar resultados en los que las empresas y el público en general pueden confiar.

Un sistema paso a paso para iniciar su carrera en Web3 y conseguir trabajos criptográficos bien remunerados en 90 días.

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
Peso mexicano modera pérdidas; perfila caída semanal: Consulta el precio del dólarEste viernes, el peso mexicano recorta las pérdidas frente al dólar estadounidense observadas en la sesión overnight tras darse a conocer que el PIB de México creció más de lo anticipado en el tercer trimestre, pero con el dato de inflación de la primera quincena de noviembre anticipando que el Banco de México (Banxico) recortará las tasas de interés en su próxima reunión.
Autor  Investing
20 hace una horas
Este viernes, el peso mexicano recorta las pérdidas frente al dólar estadounidense observadas en la sesión overnight tras darse a conocer que el PIB de México creció más de lo anticipado en el tercer trimestre, pero con el dato de inflación de la primera quincena de noviembre anticipando que el Banco de México (Banxico) recortará las tasas de interés en su próxima reunión.
placeholder
Nvidia decepcionó, pero ¿qué acciones saldrán beneficiadas del reporte 3T?El último informe de resultados de Nvidia destaca la creciente demanda de IA por parte de las empresas, con implicaciones positivas para los fabricantes de servidores Dell Technologies (NYSE:DELL), Hewlett Packard (NYSE:HPQ) Enterprise (NYSE:HPE) y SuperMicro, según los analistas de Citi.
Autor  Investing
11 Mes 22 Día Vie
El último informe de resultados de Nvidia destaca la creciente demanda de IA por parte de las empresas, con implicaciones positivas para los fabricantes de servidores Dell Technologies (NYSE:DELL), Hewlett Packard (NYSE:HPQ) Enterprise (NYSE:HPE) y SuperMicro, según los analistas de Citi.
placeholder
¿Un año perdido? ‘Riesgo Trump’ frustra la esperanza alcista de la Bolsa MexicanaLa expectativa de que la Bolsa Mexicana de Valores (BMV) logre cerrar el 2024 por lo menos al mismo nivel que lo hizo en el 2023 han quedado prácticamente desvanecidas.
Autor  Investing
11 Mes 21 Día Jue
La expectativa de que la Bolsa Mexicana de Valores (BMV) logre cerrar el 2024 por lo menos al mismo nivel que lo hizo en el 2023 han quedado prácticamente desvanecidas.
placeholder
Las acciones seguirán subiendo gracias a la IA y los recortes de tasasLa fuerte subida de los rendimientos de los bonos del Tesoro se ha señalado como un viento en contra para las acciones, pero los analistas de UBS (SIX:UBSG) creen que los actuales recortes a las tasas de interés de la Reserva Federal y la promesa de la inteligencia artificial pueden proporcionar un colchón para que las acciones continúen su racha alcista.
Autor  Investing
11 Mes 20 Día Mier
La fuerte subida de los rendimientos de los bonos del Tesoro se ha señalado como un viento en contra para las acciones, pero los analistas de UBS (SIX:UBSG) creen que los actuales recortes a las tasas de interés de la Reserva Federal y la promesa de la inteligencia artificial pueden proporcionar un colchón para que las acciones continúen su racha alcista.
placeholder
MicroStrategy hace historia: compra récord de Bitcoins por 4,600 millones de dólaresMicroStrategy Incorporated (NASDAQ:MSTR) sumó 52,000 bitcoins a su cartera por valor de 4,600 millones de dólares durante la última semana, lo que supone la mayor compra en la historia de la compañía, según ha revelado la empresa de software en un documento regulatorio presentado el lunes.
Autor  Investing
11 Mes 19 Día Mar
MicroStrategy Incorporated (NASDAQ:MSTR) sumó 52,000 bitcoins a su cartera por valor de 4,600 millones de dólares durante la última semana, lo que supone la mayor compra en la historia de la compañía, según ha revelado la empresa de software en un documento regulatorio presentado el lunes.
goTop
quote