观点网讯:7月30日,阿里通义千问推出新模型Qwen3-30B-A3B-Instruct-2507,以提升AI长文本理解能力至256K,并优化参数效率。
该模型采用非思考模式,仅激活3B参数即可媲美Gemini2.5-Flash和GPT-4o等闭源模型性能。目前已开源。
另据官方博文披露,Qwen3-30B-A3B-Instruct-2507模型的参数总量为305亿,激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度原生支持262144个tokens。