现阶段VLA并不没有表现出对WA的劣势,WA架构的优势是面向未来更高阶的应用,VLA相比于WA架构的上限太低。论证这个问题不用去扯那么多技术术语,因为:VLA的处理流程就是Vision(视觉)转L(语言)转A行动首先,人类处理视觉信息的流程不是先转译成语言,而是直接反应。如果不认可这个逻辑的话,马老板关于视觉路线以人类靠眼镜就可以行动的逻辑基础也就没了。其次,如果视觉转语言指导行动的这套技术已经非常可靠了,那么现在应该可以直接用VL + 耳机代替导盲犬指导盲人在公开道路上健步如飞了。不要以为这是诡辩,因为在朝鲜战场上就有一个眼被打残的背着一个腿被打残的,直接冲锋。
现阶段VLA并不没有表现出对WA的劣势,WA架构的优势是面向未来更高阶的应用,V
雨雪戏说汽车啊
2026-01-27 12:10:23
0
阅读:0