读AI赋能06多模态

2025-10-21  本文已影响0人  躺柒
读AI赋能06多模态.png

1. 照片

1.1. 2000年,全世界共拍摄了800亿张照片

1.2. 到2015年,全球拍摄的照片数量约为1.6万亿张

1.3. 不仅将人们过去需要付费的成本降低到几乎为零,更具深远意义的是,这些新技术让我们能够做全新的事情,比如用照片做笔记

1.4. 新的能力所带来的价值不仅仅是让摄影师每次拍照节省50美分

1.5. YouTube开始成为一个以视觉驱动的、实用的维基百科

2. 更公平的知识

2.1. 知识的获取也可能带来风险

2.2. 算法助推

2.3. 私人公地通过让知识和机会更公平地被获取,增强了个体能动性、教育机会公平性、社会流动性,并最终促进了职业成长

2.4. 数字公地的运作方式与受到限制的传统公地(如共享牧场和其他自然资源)的运作方式截然不同

3. 价值双赢

3.1. 《公地悲剧》

3.2. 在早期,互联网本身就是一种新型的公共池资源

3.3. 在数字平台上,即使你广泛使用它们,也不会降低他人的使用能力

3.4. 数字公地的运作方式与传统的物理公地截然不同

3.5. 如今,推动大部分私人公地运作的基本契约,是用户获得免费服务,作为交换,平台运营商获得对用户生成数据的访问权限

3.6. 并非所有用户为平台创造的价值都完全相同

3.7. 并非所有数据都具有同等价值,用户在生成数据时投入的时间和精力也不相同

3.8. 情境因素也很重要

3.9. 强调数据隐私对于保护个人权利固然至关重要,各种数据也首先是一种私有财产,并因此具备内在价值

4. 多模态AI

4.1. 当人们试图限制创造、共享数据的数量及数据共享的范围时,悲剧才会发生

4.2. AI能够从我们目前生成的海量数据中进行分析、评估、检索、总结和整合,从而使私人公地的价值不断提升

4.3. 与即使精心管理也会随着时间推移而枯竭的物理公地不同,数字公地往往会变得越来越好,甚至好得多

4.4. 传统搜索引擎并不擅长揣测用户的需求

4.5. AI很快将成为你与几乎所有服务之间的智能界面层

4.6. 一个完全多模态的模型可以处理文本、音频、图像和视频的任何组合

4.7. 新的感知能力让AI模型从云端的无形实体转变为与你共享空间和体验的现场实体

4.8. 手机

4.9. 先进的AI助手还能以无缝的方式整合利用多个私人公地资源,为用户提供个性化服务和增值体验

4.10. AI开发者在使用大量数据训练新模型时,并不是在提取或消耗稀缺资源

4.11. 即使今天的大语言模型不再有任何进步,当下20岁的普通年轻人在一生中从这些大语言模型中获得的消费者盈余,可能仍将达到数百万美元

上一篇 下一篇

猜你喜欢

热点阅读