Si bien estas grandes tecnologías y otras están invirtiendo miles de millones de dólares enfocándose en desarrollar grandes LLM para manejar muchas tareas diferentes, la realidad de la IA es que no existe una solución única para todos, ya que se necesitan modelos de tareas específicas para las empresas. Según Matt Garman, director ejecutivo de AWS, en un comunicado sobre su asociación e inversiones en expansión, ya existe una respuesta abrumadora de los clientes de AWS que están desarrollando IA generativa impulsada por Anthropic. Para la mayoría de las empresas, los LLM siguen siendo la opción número uno para ciertos proyectos, pero para otras, esta opción puede resultar costosa en costo, energía y recursos informáticos. Steven McMillan, dent y director ejecutivo de Teradata, que ha ofrecido un camino alternativo para algunas empresas, también tiene otras opiniones. Está seguro de que el futuro está en los SLM. "Al mirar hacia el futuro, creemos que los modelos de lenguajes pequeños y medianos y los entornos controlados, como los LLM de dominios específicos, proporcionarán soluciones mucho mejores". ~ McMillan Los SLM producen resultados personalizados sobre tipos específicos de datos, ya que los modelos de lenguaje están específicamente capacitados para hacerlo. Dado que los datos generados por los SLM se guardan internamente, los modelos de lenguaje se entrenan con datos potencialmente confidenciales. Dado que los LLM consumen mucha energía, las versiones en idiomas pequeños están capacitadas para adaptar tanto la informática como el uso de energía a las necesidades reales del proyecto. Con tales ajustes, significa que los SLM son eficientes a un costo menor que los grandes modelos actuales. Para los usuarios que quieran utilizar la IA para obtener conocimientos específicos, existe la opción de LLM de dominio específico, ya que no ofrecen conocimientos amplios. Está capacitado para comprender en profundidad solo una categoría de información y responder con mayor precisión, por ejemplo, un CMO frente a un CFO, en ese dominio. Según la Asociación de Científicos de Datos (ADaSci), desarrollar completamente un SLM con 7 mil millones de parámetros para un millón de usuarios requeriría solo 55,1 MWh (megavatios hora). ADaSci descubrió que entrenar GPT-3 con 175 mil millones de parámetros consumió aproximadamente 1.287 MWh de electricidad y la potencia no incluye cuando entre oficialmente en uso por parte del público. Por lo tanto, un SLM utiliza aproximadamente el 5% de la energía consumida durante la formación de un LLM. Los modelos grandes generalmente se ejecutan en computadoras en la nube porque utilizan más potencia informática que la que jamás esté disponible en un dispositivo individual. Esto genera complicaciones para las empresas, ya que pierden el control sobre su información a medida que se traslada a la nube, y respuestas lentas a medida que viajan a través de Internet. De cara al futuro, la adopción de la IA por parte de las empresas no será única para todos, ya que la prioridad será la eficiencia y la selección de la mejor y menos costosa herramienta para completar las tareas, lo que significa elegir el modelo del tamaño adecuado para cada proyecto. Esto se hará para todos los modelos, ya sea un LLM de propósito general o LLM más pequeños y específicos de un dominio, según qué modelo ofrecerá mejores resultados, requerirá menos recursos y reducirá la necesidad de que los datos migren a la nube . Para la siguiente fase, la IA será vital para las decisiones empresariales, ya que el público tiene una gran confianza en las respuestas generadas por la IA. "Cuando se piensa en entrenar modelos de IA, estos deben construirse sobre la base de excelentes datos". ~ McMillan "De eso se trata, de proporcionar ese conjunto de datos confiables y luego brindar las capacidades y capacidades analíticas para que los clientes y sus clientes puedan confiar en los resultados", agregó McMillan. Dado que la eficiencia y la precisión tienen una gran demanda en el mundo, los LLM más pequeños y de dominios específicos ofrecen otra opción para brindar resultados en los que las empresas y el público en general pueden confiar. Un sistema paso a paso para iniciar su carrera en Web3 y conseguir trabajos criptográficos bien remunerados en 90 días. Por qué los SLM son una opción preferida