Skip to content
Projects
Groups
Snippets
Help
Loading...
Help
Submit feedback
Sign in / Register
Toggle navigation
C
cmscenter
Project
Project
Details
Activity
Releases
Cycle Analytics
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
Issues
0
Issues
0
List
Board
Labels
Milestones
Merge Requests
0
Merge Requests
0
Wiki
Wiki
Snippets
Snippets
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Charts
Create a new issue
Commits
Issue Boards
Open sidebar
吕祺
cmscenter
Commits
c2dfec2b
Commit
c2dfec2b
authored
Nov 07, 2023
by
吴桐
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
Create article “共话开源ai未来之路”
parent
f49e68a4
Changes
1
Pipelines
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
93 additions
and
0 deletions
+93
-0
共话开源ai未来之路.md
content/article/共话开源ai未来之路.md
+93
-0
No files found.
content/article/共话开源ai未来之路.md
0 → 100644
View file @
c2dfec2b
---
title
:
共话开源AI未来之路
type
:
最热课程
createDate
:
2023-08-28T07:39:24.882Z
content
:
>-
<!--StartFragment-->
开源生态不断拓宽AI疆域的边界,也为广大创业者和开发者提供了绝佳的创新机遇。那么,创业公司应该如何拥抱这股澎湃的开源力量?
**锦囊一:守护Core Business,开疆扩土**
面对大模型和开源带来的机会与挑战,Meta高级副总裁Bill Jia给出的建议是**“先筑城、再建护城河”**。企业首先应当准确理解自身在行业中的生态位置,牢牢守住自己的核心业务(Core Business)和自己的底线(Bottom Line),“看好自己的奶酪”;其次,要对大模型和开源抱有开放态度,并基于新技术去思考是否有可能扩展自身的业务,开疆扩土;最后,大模型带来的变革如同第四次产业革命,终究会一同把蛋糕做大,在这样的过程中要思考可以尽早切入哪些关键版图。
**锦囊二:模型选取综合考虑业务场景、合规等因素**
开源大模型百花齐放,企业如何选取最适合自己的模型?Hugging Face中国区负责人王铁震指出,仅依赖学术测评是远远不够的,需要企业针对自身业务场景,并用专属数据集进行测试,综合评估模型的能力是否匹配。例如选取文生图模型,美学评分并不是唯一标准,而要综合看是否符合企业的目标受众与场景。这也再次体现出企业建立自身数据集的重要性,**“数据集的投资回报是非常长期的,不管未来最火的模型是谁,都可以用它来进行训练和测评。”**
此外,王铁震也建议企业在选取开源模型时,需要关注当地合规与监管政策,包括模型的license是否可商用、模型训练时的透明度、训练数据版权问题、数据是否符合价值观等等。
企业的竞争最终靠人才,王铁震也特别建议创业公司可以**利用开源社区来发现优秀人才,建立人才竞争力。**如有企业开源了垂直领域大模型,可以顺势挖掘社区中的优秀开发者和贡献者,帮助企业更有针对性地锁定和筛选人才。
**锦囊三:模型差距无需过忧,唯快不破**
针对开源模型在性能表现上对比闭源的差距,陈恺指出,开源模型的迭代速度很快,**企业应该将关注重点更多聚焦在自身业务场景和流程上,模型是可以不断去更换和迭代的。**“有可能今天你觉得模型效果不好,一个月之后一个新的开源模型出现,之前的问题就解决了;此外我们也发现开源模型的规模也在不断提升,从此前比较普遍的7B,到13B、30B乃至更大量级。”
在这样的竞争格局下,创业企业**“唯快不破”**。“有些赛道很卷,那么就需要企业以更高效率把一个垂直领域的应用、一个核心场景跑通,进而积累更多用户反馈和来自真实世界的数据,形成数据飞轮,把时间优势转化为企业的护城河。”
**锦囊四:沉淀有核心竞争力的数据,长期投入**
十方融海创始人黄冠则结合企业一线实践,分享如何基于核心业务落地应用AI大模型。
作为一家数字职业在线教育科技公司,十方融海目前重点关注如何**利用AI创新引擎,提升学生的学习体验和教学效率。**最初十方融海将大模型技术用于帮助学生在学习短视频制作时,进行文案辅助生成;此后探索用AI来批改语言创作类作业;并进一步思考,是否有可能基于大模型,高效回答学生提出的基础性和知识性问题,提升助教的效率。
“我们快速学习、尝试和迭代,并从今年4月开始,基于LLaMA做微调,研发出OpenBuddy-LLaMA系列开源模型,拥有优秀的问题理解和回答能力。”过程中,黄冠和团队也通过模型优化、数据标注等方式,不断提高回复准确率,也探索模型的多轮对话能力。与此同时,通过在核心业务场景迭代模型,公司也沉淀了有核心竞争力的数据。
今年8月,十方融海发布并开源了OpenBuddy-LLaMA2-70B模型,这是一个基于LLaMA2基座的全新跨语言对话模型,在十方融海内部业务的商用场景测试中已经取得非常好的成绩。
面向未来,黄冠对于中文开源模型及中文语料抱有期待,并且“做好了长期投入的心理准备”,**“不要高估大模型短期的效果,也不要低估大模型长期的影响”**。
流水不争先,争的是滔滔不绝。开源模型令人目不暇接,但最终给予企业的命题仍旧是——是否足够开放以拥抱技术变化,是否足够有定力守住核心场景。
<!--EndFragment-->
-
--
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment