Zamba2是Zyphra发布的一种混合SSM模型,仅3T训练Token,在7B大小LLM中评分领先,我们今天也来体验下。
我们打开Zamba2官网,可以用谷歌账号授权登录。
我们先让它来个自我介绍,看看有什么功能?
自我介绍倒是很详细,但是具体的功能却没有说明。
难倒一众语言大模型的数字题肯定是要问的?
好吧!不出意外的回答错误,看看数学推理能力还有待提高。
再来看看编程能力如何?让它写款WordPress插件吧!
代码倒是写出来了,但是从代码来看想实现理想中的功能估计很难。
最后再来让它制定下旅游路线,看看制定的路线如何?
简单的不能再简单了,这路线毫无用处。
Zamba2总归是7B大小,要求肯定不能太高,总归简单的问题也能解答。