Em 27 de dezembro, a Li Auto apresentou o '2024 Ideal AI Talk' por três dias consecutivos, compartilhando suas últimas reflexões sobre inteligência artificial, incluindo avanços na direção inteligente e a tecnologia Ideal Classmate de IA. Li Xiang anunciou que o Ideal Classmate, baseado no modelo de linguagem grande Mind GPT, passou do sistema interno para os smartphones, com o aplicativo lançado completamente em 27 de dezembro. Além disso, a Li Auto anunciou que a versão OTA 7.0 do sistema interno será completamente enviada para os usuários do AD Max até o final de dezembro, com capacidades de inferência de IA visual, recursos de ponta a ponta de alta velocidade e atualizações do Mind GPT-3o e Mind Diffusion V2.0.
Durante a transmissão ao vivo de três dias, Li Xiang anunciou que a Li Auto se transformará em uma empresa de IA. Detalhes específicos podem ser encontrados nos links fornecidos. No segundo dia da transmissão ao vivo, Li Xiang e o líder em direção autônoma, Lang Xianpeng, discutiram as tendências de desenvolvimento da direção autônoma da Li Auto. Após a iteração atual do sistema end-to-end + VLM, espera-se alcançar a direção autônoma supervisionada L3 até 2025. Mais detalhes podem ser encontrados no link.
● Ideal Classmate e direção autônoma são os dois principais produtos de IA da Li Auto
Li Xiang, presidente e CEO da Li Auto, disse: 'Ideal Classmate e direção autônoma são frequentemente vistos como campos independentes. Nosso modelo de linguagem grande, Mind GPT, é uma inteligência cognitiva que conecta o mundo digital, enquanto a direção autônoma é uma inteligência espacial relacionada ao mundo físico. Estamos explorando ambos os campos simultaneamente e acreditamos firmemente que a combinação de inteligência cognitiva e inteligência espacial—o que chamamos de Modelo Visual Linguagem Ação (VLA)—é uma oportunidade mais promissora e alcançável.'
● Direção autônoma supervisionada L3: não uma extensão da direção assistida L2, mas um precursor da direção autônoma L4
Nas diferentes etapas da direção autônoma, L3 refere-se à direção autônoma supervisionada, que não é uma extensão da direção assistida L2, mas um precursor da direção autônoma L4 de alto nível. A direção assistida implementa apenas funções específicas, enquanto a direção autônoma envolve a capacidade total. A direção assistida tradicional L2 depende das soluções de direção autônoma de gerações anteriores, executando funções de direção inteligente com base em condições pré-estabelecidas em diferentes cenários, mas incapaz de lidar com todos os casos extremos. A Li Auto desenvolveu uma solução de sistema duplo end-to-end + VLM, usando inteligência artificial para melhorar as capacidades de direção autônoma, iterando e aprimorando continuamente com a Lei de Escalabilidade para adaptar-se a todos os ambientes de direção.
Com a iteração contínua do sistema duplo end-to-end + VLM, a Li Auto espera alcançar a direção autônoma supervisionada L3 até 2025 e fornecer aos usuários um produto integrado de ponta a ponta. Em 25 de dezembro, a quilometragem total de direção inteligente da Li Auto alcançou 2,9 bilhões de quilômetros, e o poder de computação para treinamento aumentou para 8,1 EFLOPS.
● Veículos elétricos não são o fim da jornada empresarial de Li Xiang
Li Xiang acredita que depois de muitos anos de desenvolvimento, a competição com os fabricantes de automóveis tradicionais pode ter terminado, e muitos novos entrantes surgiram. Inicialmente, a competição era entre as novas forças e os fabricantes tradicionais, mas agora empresas como Huawei e Xiaomi entraram no jogo, mudando o cenário competitivo. Isso é o que torna o mundo tão interessante e rico.
● E o carro elétrico da Xiaomi? Você deu algum conselho a Lei Jun?
Li Xiang: Eu disse a ele 'Você precisa se dedicar completamente', e se a Xiaomi seguir esse caminho, o carro elétrico terá sucesso. Lei Jun é muito hábil com hardware, o que é indiscutível. Ele não faz apenas bons carros; suas TVs e aparelhos de ar-condicionado também são excelentes, o que é sua vantagem inerente, e ele aborda esses projetos com uma mentalidade apaixonada. Temos um bom relacionamento com a Xiaomi, e Lei Jun nos ajudou muito ao apoiar nossos modelos Ideal MEGA e L6. Somos muito gratos pela ajuda dele.
Transcrição completa de perguntas e respostas:
01. O 'Momento do iPhone 4' chega na fase do Agente
Zhang Xiaojun: Quando você usou o ChatGPT pela primeira vez e o que achou?
Li Xiang: Eu usei quando foi lançado. Minha maior impressão foi que parecia o que a IA deveria ser.
Zhang Xiaojun: Se você fosse o CEO da OpenAI, faria um trabalho melhor do que o Sam?
Li Xiang: Não, acho que Sam Altman e sua equipe fizeram um excelente trabalho.
Zhang Xiaojun: Se fosse o CEO da OpenAI agora, o que faria?
Li Xiang: Hoje, a OpenAI está definindo a primeira fase da AGI (Inteligência Artificial Geral): o chatbot. Eu acredito que a OpenAI fez o melhor ao fornecer esse produto. A segunda fase é o raciocinador, e na terceira fase, o Agente (agente de IA) marcará o 'momento do iPhone 4', onde pessoas comuns poderão usá-lo, completando tarefas de forma independente e contínua sem depender de prompts intensivos. A forma de interação nesse momento deve ser considerada por todas as empresas líderes.
02. Tornar a interação com IA tão natural quanto a comunicação humana
Zhang Xiaojun: Por que uma montadora decidiu desenvolver seu próprio grande modelo? Como foi tomada essa decisão?
Chen Wei: Foi um consenso gradual. No final de 2022, já havíamos feito a transição para um modelo de pré-treinamento para tarefas de processamento de linguagem natural. Isso nos permitiu cobrir rapidamente e eficientemente tarefas como controle do carro, mídia e navegação. Depois de ver o rápido avanço dos grandes modelos, nos sentimos profundamente inspirados. Inicialmente, não consideramos criar um modelo tão grande, mas depois Li Xiang sugeriu que focássemos em melhorar a inteligência cognitiva do Ideal Classmate, elevando o teto. Isso guiou nosso trabalho futuro nos modelos fundamentais.
Zhang Xiaojun: Como recém-chegados, como pretendem se igualar ao ChatGPT?
Chen Wei: A OpenAI é o benchmark da indústria, e a maioria das equipes ainda está na fase L1 (chatbot). No entanto, estamos jogando um jogo infinito e nos concentraremos nos primeiros princípios da Lei de Escalabilidade para garantir uma rápida iteração. Nosso modelo Mind GPT já passou por mais de 30 iterações desde o lançamento da OTA 5.0 em dezembro de 2022.
Zhang Xiaojun: Como o Mind GPT evoluiu?
Chen Wei: O Mind GPT passou por três gerações. A versão 1.0 foi lançada em abril de 2023, e no final de 2023, a atualização OTA 5.0 levou esse grande modelo para os sistemas internos. Em meados de 2023, lançamos a versão 2.0, otimizando tanto o desempenho do modelo quanto a eficiência da inferência. A arquitetura do Mind GPT continuará a evoluir com uma mistura de especialistas (MoE) e estrutura Transformer.
Comentários0