数据分析有哪些工具?
我的看法人体艺术就是一种展示美的艺术。
人体艺术不单单只裸体,还包括健美,艺术体操,人体雕塑,人体彩绘,人体艺术摄影等。
既然说是艺术,那给人的视觉冲击就是美,而人体艺术就是世界上最美丽动人的。人体的皮肤就是世界上最美的服装。
很多人对人体艺术有疑虑,就是固执的认为,裸体就等同于黄色。
其实,对于这个问题我们国家还没有一个明确的法律界定。但有一个必须遵从的原则,那就是不能主观故意的放大性器官,只能以展示人体美学为原则,来进行艺术创作。而不是进行性诱惑。
一切的艺术行为都是让人来感受美,享受美,从而陶醉于艺术的审美过程中。
人体艺术,人体摄影艺术都从属于美学范畴,人体就是世界上最天然的艺术品,与我们经常欣赏到的插花艺术,盆景艺术,剪纸艺术一样,带给人的都是一种视觉上的精神愉悦,感受到的是一种美得熏陶。
当一个模特在灯光的照射下,摆一个造型,要求两个小时不动,即便是专职模特也会感觉很累,此时,创作者一定会尊重辛苦付出的模特,根本不会有非分之想,他们唯一想做的就是,尽其所能的表现出女性之美,而非杂念丛生,那是创作不出好作品的,也非艺术家的行为。
因为人体就是大自然最美的艺术品,而人的肌肤就是最美丽的服装,人体艺术就是对美的创造和展示,留给人的除强烈的视觉冲击,就是美的享受和熏陶。
男女两个人跳舞,心无杂念吗?是不是人在跳,心也跳的更快?
本人做过一场人体艺术活动,那才是真正的人体艺术表演,现在和大家一起分享。2002年本人就职一家高星级酒店娱乐部经理。一次筹备酒店中秋餐饮晚会,董事方提出活动节目需要新颖,本人经多次联系,最后找到了一位到日本受过培训的人体彩绘艺人。当她表演时,餐厅所有照明全部关闭,只保留舞台上的临时增加的特殊灯光。女孩全身赤裸,全身从头到脚涂满特殊粉彩,在特殊灯光照耀下伴着音乐翩翩起舞。整个餐厅顿时鸦雀无声,都在欣赏一个彩人的表演。表演结束后董事方一位亲戚不相信是全祼表演,特意到后台要检查女孩。最后在经济人允许下看了女孩的背影,看到了臀沟方才相信。
这是本人第一次运作人体彩绘艺术表演,也是唯一的一次。后来再也没有联系他们。
大众图像分析:人类视觉与计算机视觉的异同
文|炎左
编辑|炎左
前言大众图像是指由大量来自不同来源的图片组成的、广泛传播和使用的图像集合。这些图片普遍存在于社交媒体、新闻网站、博客等互联网平台上,并且通常是由用户上传或分享的,而非由专业摄影师或机构提供。
大众图像的解释以及数据集大众图像是现代通信的重要组成部分,它们可以用于各种用途,如广告、新闻报道、艺术表达、市场分析等。然而,由于其来源广泛、质量参差不齐、内容复杂多样,对于大众图像的处理和利用也面临着一系列的挑战和问题。
对于大众图像的处理和利用需要涉及其中包括计算机视觉、机器学习、通过这些技术的应用,可以对大众图像进行分类、检测、分割、识别、过滤等操作,以实现更精确、高效和个性化的使用需求。
此外,大众图像的质量评估也是一个重要的研究方向。因为随着大众图像的不断增加和使用,不断有低质量、变形、虚假等问题的图片出现,这给他们的有效利用和使用带来了很大的困难。因此,需要研发一些基于人工智能、机器学习等技术的大众图像质量评估方法,以帮助用户更好地选择和使用大众图像。
大众图像作为一个十分重要的图像集合,具有广泛的应用前景。但是,对于其存在的问题和挑战,还需要进一步的研究和探索,以期能够更好地利用这些图像资源。
是一个具有1000个类别的大型图像数据集,包含超过150万张带有标签的照片。它被广泛用于计算机视觉、深度学习等领域的研究和教育。
COCO:是一个受欢迎的大众图像数据集,它包含超过33万张图片和超过25万个图像实例的标注信息,涵盖了80个常见的对象类别。
Flickr30k:是一个基于图像分享网站的数据集,包含超过30000张由人类描述的图片。这些描述是由标注员编写的,可以用于图像描述生成和自然语言处理研究。
Places365:是一个包含超过180万张图片,并进行了划分的数据集。它涵盖了大量的场景,包括城市、野外、室内等等,图像识别等领域。
Open Images:是由谷歌公司发布的一个包含超过900万张图片,并涵盖了数千个不同的对象类别。它被广泛用于目标检测和分类等方面的研究。
大众图像数据集是计算机视觉、深度学习等领域中的重要资源,可以为研究人员和开发者提供许多有用的信息和数据。虽然这些数据集存在一些问题和挑战,如数据质量、数据标注的准确性等,但通过更细致的标注和技术手段的应用,这些数据集仍然可以为图像研究和应用带来巨大的帮助。
社交媒体:社交媒体平台(如Facebook、Instagram和Twitter)是大众图像最常见的使用场景。用户可以通过上传或共享图片与朋友、家人以及广泛的在线社区交流。
新闻报道:新闻出版商可以使用大众图像作为报道的一部分。例如,在紧急事件或自然灾害发生时,新闻机构可以使用照片来展示灾区和受灾者的情况。
广告宣传:大众图像可以用于各种类型的广告宣传。在线广告可以使用大量的库存照片作为背景,从而吸引用户的注意力。品牌主还可以使用特定的照片作为广告标语或设计的一部分,以提高品牌知名度。
艺术创作:艺术家可以使用大众图像来制作多种形式的作品。通过对大众图像进行艺术化处理、颜色和样式的改变,艺术家可以创作出独特的艺术品,涵盖了从简单的插图到复杂的数字艺术。
旅游和地理信息:它们可以用于旅游和地理信息系统。例如,通过使用大众图像,旅游公司可以为其顾客提供更好的预览和理解旅游景点。同样,在地理信息界面中,大众图像也可以帮助用户快速识别特定位置和环境的属性。
总之,大众图像是一个重要的媒体形式,具有许多实用的应用场景。随着技术的发展和数据质量的不断提高,我们预计这些应用场景将继续扩大和深化。同时,对于大众图像的利用和应用也需要注意保护用户的隐私和版权问题,以合法、公平、透明地实现这些应用。
大众图像处理的技术综述特征提取:大众图像的特征提取包括纹理、边缘等方面。其中,颜色特征可以通过色调直方图、彩色矩等方式提取;形状特征可以通过轮廓描述符、极点距离等方式提取;纹理特征可以通过局部二值模式、滤波器等方式提取;边缘特征可以通过Canny、等算法提取。
目标检测:目标检测可以用于在大众图像中查找和定位特定对象,例如动物、人、车等。传统的目标检测算法包括Haar特征、HOG特征、SURF、SIFT等。
图像分割:图像分割可以将大众图像分成不同的区域,以实现对对象的划分和识别。传统的分割算法包括基于阈值的分割、区域增长。
卷积神经网络(CNN):CNN是深度学习领域中最常用的图像分析算法之一。它通过多层卷积和提取图像特征,在传统方法的基础上实现更加准确和高效的大众图像分析。
循环神经网络(RNN):RNN可以用于对数据进行处理,文本和时间序列等。在大众图像中,RNN可应用于图像标题生成、图像描述、情感分析等领域。
生成对抗网络(GAN):GAN是判别器组成的神经网络,用于生成具有真实感的大众图像。它已被用于图像风格迁移、图像生成和修复等方面。
总之,大众图像分析和处理是计算机视觉领域的热点方向之一,传统方法和基于深度学习的算法都在不断发展和改进。未来随着技术和数据的进一步发展,我们预计这些算法将得到更加广泛和深入的应用。
Al模型:A是由5个卷积层、3个全连接层和一个x分类器组成的神经网络模型。它采用大量的卷积核和池化层对图像进行特征提取,并使用dropout方法防止过拟合问题。在I比赛中,它的错误率显著降低,标志着深度学习在大众图像分类领域的开始。
VGG模型:VGG是一个由19层卷积神经网络和3个全连接层组成的模型。该模型使用小尺寸卷积核和卷积层来提取图像特征。与Ale相比,它在I数据集上的分类准确率有所提高。
G模型:G是一个由22个卷积层和5个全连接层组成的神经网络模型,其中使用了多个并行的卷积操作和降维方法。它在I比赛中表现出色,错误率仅为6.67%。
R模型:R是深度卷积神经网络模型。该模型使用残差块(residual block)来构建深度模型,使得更深的网络不会导致性能下降和梯度消失问题。在I数据集上,它取得了最强的分类效果。
D模型:D是一个新型的深度卷积神经网络模型,其核心思想是密集连接(dense connectivity)。模型每一层的输出都与前面所有层的输出进行连接,从而增强特征共享和信息流动,减少了模型参数,提高了模型的精度和速度。
总之,大众图像深度学习模型的结构和特点各不相同,但它们都具有一些通用优势:提取高效的图像特征、自动学习代表性特征、参数共享的能力以及适应不同场景的能力等。未来随着技术的发展和数据的不断更新,我们预计这些模型将进一步优化和完善。
面向大众图像的智能识别技术研究传统机器学习方法:传统机器学习方法主要采用特征提取和分类器构建来实现大众图像分类。常用的特征提取方法有SIFT、HOG、LBP等,而分类器则包括SVM、决策树、KNN等。这些经典方法在小规模数据集上表现较好,但难以适应较大规模的复杂数据集。
深度学习方法:深度学习方法借络结构实现了高效的大众图像分类。目前,常见的深度学习分类模型包括:Al、VGG、G、Rt等。这些模型具提取和表示能力,在大规模和复杂的数据集上表现良好。
准确率(Accuracy): 准确率是指分类器在总体数据集上正确分类的样本数占总体样本数的比例。该标准常用于评估模型的整体分类效果。
精确度(Precision): 精确度是指分类器正预测为正的样本数占所有正预测样本数的比例。该标准常用于评估那些要求错误较小的应用场景,例如医学诊断等。
召回率(Recall):召回率是指分类器正确预测为正的样本数占所有真正正样本数的比例。这一标准常用于评估那些要求正确率较高的应用场景,例如安全检测等。
F1 值(F1 Score): F1 值是精确率和召回率的调和平均值,它能综合评估分类器的性能表现。
综上所述,大众图像分类模型及其分类标准是计算机视觉领域中一个重要的研究方向,当前研究正朝着更加适应实际应用场景、更加高效和准确的方向不断发展。
大众图像分割是指把一张图片中的物体和背景进行像素级别的分割并选出物体的轮廓。常用的分割方法包括Gt、Watershed、基于深度学习的语义分割以及实例分割。语义分割主要是将图片中每一个像素点都用特定的标签进行分类,而实例分割则是在语义分割的基础上,将同一类物体的不同实例进行区分。
近年来,基于深度学习的大众图像分割技术已经开始逐渐取代传统的算法,并在许多应用领域中取得了显著的效果,如Mask R、U-Net、Dee系列等。
大众图像追踪是指在视频中跟踪一个或多个目标的位置和大小。根据跟踪的方式,大众图像追踪可以分为基于特征的追踪和基于深度学习的追踪。其中,基于特征的追踪常见的方法包括卡尔曼滤波、粒子滤波;基于深度学习的追踪则主要使用卷积神经网络。
结语大众图像是指在数字化时代,由于相机的普及和网络技术的发展而得以广泛流传的图片。而人类美学观念是对美的本质属性和审美标准的认识和感受。
大众图像与人类美学观念的多样性:随着数字化技术的发展,大众图像的数量、种类和来源也变得非常丰富。不同主题、角度、色彩、光影和构图等方面的多样性,为人类美学观念的丰富性提供了更加广泛的视觉资料。
参考文献:国产漫画市场定位[J]. 秘振莉.河北理工大学学报(社会科学版),2009(06)
漫说漫画[J]. 李土.新闻采编,2006(02)
将漫画融入报纸中[J]. 展照英.新闻导刊,2005(03)
天眼新知|一根小鱼竿撬动百亿大产业 垂钓从小众迈向大众
一、钓鱼产业:雅俗共享动静结合
垂钓最早可追溯到古代先民的生产活动,其后经过历史更迭、生活方式的变革,逐渐成为一项陶冶情操、修身养性的活动,历经千年不衰为人所爱。
近年来,随着网络流量的不断加持,垂钓从小众走向大众,但凡是条不大不小的“河”,都会引来无数钓友,挥“杆”方遒,好不欢乐。而随着人群规模的扩大,连接上下游的产业链开始发力:上接水产养殖,下连鱼饵钓具,还辐射与之相关的户外用品、直播带货、餐饮民宿,小小垂钓业俨然成为三产融合的综合体。
据某机构不完全统计,我国每年的钓鱼人数约有1.6亿,18岁以下的钓鱼人群占总数的13%,18至24岁占10%,25至45岁占46%。我国钓鱼产业的参与人数增量是十分庞大的,整体的年龄趋势也有了明显的偏向,钓鱼活动已经不再是属于中老年人群的“专利”,而是逐渐向年轻化、时尚化、创意化转变。
无论从政策措施、市场潜力甚至到资源禀赋,我国在发展垂钓产业的各个方面均有较大的潜力可挖掘:
1.政策支持给力
近日,农业农村部、文化和旅游部以及国家文物局联合印发《关于加强渔文化保护、传承和弘扬工作的意见》。其中提到,鼓励发展以渔文化为主题的休闲垂钓、渔事体验、民宿美食和科普教育等产业,推动保护利用。
除国家级政策支持外,诸如:海南省出台了《海南省休闲渔业管理办法(试行)》、山东省出台了《关于促进海洋渔业高质量发展的意见》等,多个地方政府也在积极支持垂钓产业发展。
2.市场规模潜力大
休闲渔业是渔业“五大产业”之一,是拓展渔业多种功能、丰富渔业产业形态的重要方面,其中,休闲垂钓及采集业为主导产业之一。
据《中国休闲渔业发展监测报告(2022)》数据显示,2021年,我国休闲垂钓及采集业营业额252.21亿元,同比下降1.96%。其中,淡水休闲垂钓及采集业营业额212.00亿元,同比增长0.80%;海水休闲垂钓及采集业营业额40.21亿元,同比下降14.36%。
淡水休闲垂钓及采集业中,营业额超过10亿元的省份有8个,依次为湖北、江苏、安徽、四川、湖南、江西、山东和广东。前六名均位于长江流域,6省营业额总和148.17亿元,占全国总量的69.89%。海水休闲垂钓及采集业中,山东、广东、辽宁的营业额分别占全国总量的46.91%、19.50%和14.76%。
3.鱼类资源丰富
我国拥有300万平方千米的管辖海域,地跨热带、亚热带、温带三大气候带,海洋生物资源十分丰富。其中有许多适于垂钓的肉食性鱼类,如鲷科、石首鱼科鱼类和石斑鱼类等。自然分布的淡水鱼类有700多种,包括许多适于垂钓的肉食性名贵鱼类,如鲈、鳜、鲶等。辽阔的水面及丰富的鱼类,尤其是许多江河、湖泊地处风景秀丽的旅游区,为发展内陆休闲渔业提供了条件。
二、产业链分析:环节众多 钓具是核心
作为户外运动的重要分支之一,垂钓产业从钓具生产到休闲钓鱼以至到竞技钓鱼,产业发展涉及多个环节。
休闲钓鱼行业包括各类钓鱼活动及其相关服务企业。目前国内示范休闲渔业基地超过500家,全国共有上万家休闲钓场。休闲渔业呈现出发展加快、内容丰富、产业融合、领域拓展的良好势头,规模和效益双双提升。
中国钓鱼运动协会(China Angling Association,简称CAA)管理国内主要钓鱼赛事,并对参赛钓手进行等级认证和积分排名。2023中国休闲垂钓大赛、2023年中国(武汉)垂钓挑战赛、2023年“鸿健杯”全国钓鱼公开赛等热门赛事吸引着众多钓友的关注。这些赛事由专业媒体如四海钓鱼频道进行转播,提供给全国钓友。而赛事的赞助商则主要来自于各大钓具厂商及钓场,媒体的报道曝光将极大地提升知名度,吸引业余钓友的消费。
钓鱼产业以业余休闲为主,更多的重心在于全民参与,因此钓具是产业链的核心。钓具商与饵料商主要承担着为垂钓者提供各类垂钓工具和辅助用具的服务。钓具的种类繁多,主要分为钓鱼竿、鱼钩、渔线轮、鱼线、鱼饵和渔具配件几大类,而每一大类中又可分为8-10个的小类。国外钓具产业发展相对成熟,钓具商均拥有悠久的历史、技术标准高,高端品牌钓竿价格单支可超过一千美金。国内钓具竞争相对分散,未有形成统治力的品牌。与此同时,随着互联网购物趋势明显增长,电商平台成为钓具主要销售渠道,传统渔具店则向专业顾问、场景体验、品牌连锁等方向发展。
天眼查数据显示,截至目前,现存渔具相关企业78.5万余家,其中,2023年上半年新增注册相关企业24.5万余家,与2022年同期相比上涨109.8%,凸显出企业对于产业未来发展的信心。
从地域分布来看,浙江、江西以及海南所拥有的相关企业数量位居前列,分别拥有10.9万余家、10.4万余家以及9.4万余家。
三、用户特征:趋向年轻化
垂钓作为一种传统的活动,长期以来被认为是中老年人专属活动,但近几年垂钓活动逐渐年轻化、休闲化,成为年轻人青睐的一种户外运动,行业得到快速发展。某电商平台的消费大数据显示,“露营、垂钓和冲浪”超越了宅家的“手办、盲盒和电竞”,成为90后的“破产消费”新三宠。其中,让人感到反差最大就是“垂钓”,这个看似中老年的专属活动,如今成了年轻人新的栖息地。
网络公开数据显示,当前我国的垂钓用户中,24岁以下人群占比不断增长,占比达到24%左右,而25-45岁年龄段是主要的垂钓爱好者群体,占比约为45%,45岁以上的群体占比也较大。我国垂钓人群在不断年轻化,年轻用户对于垂钓装备更换频繁度较高,且更加青睐价格高、娱乐性强的设备。
受到短视频、直播等产业的发展带动,垂钓行业逐渐向年轻化方向发展。随着消费群体的改变,为了符合消费者需求,未来垂钓运营方式和装备也将不断创新,休闲垂钓场、路亚钓法等创新形式备受市场青睐。某短视频平台数据显示,00后和90后钓鱼创作者超过四成,其中80后到00后占比超70%。
四、专利分析:实用新型为主外观设计为辅
随着钓鱼运动的发展,适合各种水域、鱼种、气候条件的渔具应运而生。作为钓友核心工具的“渔具”,其科技含量越来越受到关注。
1.鱼竿
鱼竿是钓鱼的核心装备之一,正确选择鱼竿对于钓鱼效果来说有着至关重要的作用。随着市场需求的不断变化,鱼竿生产相关企业需要不断进行技术升级和创新,继而推动行业的技术进步和产品升级。
天眼查专利数据显示,近3年来,与鱼竿有关的专利持续增加,从2020的648项到2021年的730项,再到2022年的740项。另外,从2023上半年数据来看,已有专利申请454项;从专利类型来看,实用新型与外观设计相关专利数量占比位居前列,分别为48.6%以及40.5%。
2.鱼线
鱼线对于钓鱼非常重要,其质量和使用方法直接影响到钓鱼的效果,无论从承受力和耐磨性到透明度和隐蔽性再到粗细和线号都对能否“钓”到鱼影响很大。
天眼查专利数据显示,与鱼线相关的专利申请近1400余项。从近三年专利申请的数量来看,处于持续增加的态势,分别拥有161项、166项以及167项;从专利类型,超5成的相关企业属于实用新型。
3.鱼钩
鱼钩是钓鱼过程中不可或缺的一部分,其质量和材质、形状、大小及实用性以至到维护和更换等方面都会影响到钓鱼的效果。选择适合的鱼钩能够提高钓鱼成功率,钓鱼爱好者需要认真选择和保养鱼钩。
天眼查专利数据显示,与鱼钩相关的专利申请近2000项。从近三年专利申请的数量来看,2020年申请数量位居前列,拥有260项;从专利类型来看,实用新型占比56.7%,位居前列。
五、垂钓旅游:渔业与旅游的深度融合
垂钓旅游业是休闲渔业的一个分支,是指利用水体渔业资源、渔业设施、渔业生产器具、渔产品,结合当地的生产环境和人文环境而规划设计相关活动和休闲空间,体验垂钓艺术,并集旅游、休闲、娱乐功能为一体的一种产业;是人们劳逸结合的长产业链式的渔业生产方式。
天眼查数据显示,现存垂钓旅游相关企业3.5万余家,其中,安徽、湖南以及山东相关企业数量位居前列,分别拥有6800余家、2500余家。
作为渔业发展中的新领域,垂钓旅游业产值为常规渔业产值3倍以上,显示出迷人的“钱”景。垂钓旅游业把休闲、娱乐、旅游、餐饮等行业与渔业结合为一体,提高了渔业的社会、经济和生态效益,并逐步成为现代渔业的一个支柱产业,市场前景十分广阔。一些地方还准备建设国际垂钓中心和豪华游钓场、适合普通游客的休闲垂钓中心、垂钓俱乐部、娱乐广场等项目来满足不同顾客的需求。垂钓旅游业必将是渔民致富的新路。
以有海上高尔夫的海钓为例,随着国内旅游消费升级,在海南文昌、山东青岛、浙江舟山等海洋渔业资源丰富的城市,海钓正逐渐成为当地发展海洋休闲经济的新亮点,对于应对渔业资源短缺、保护海洋生态环境、帮助渔民转产转业、推动消费等具有重要意义。
垂钓旅游业把休闲、娱乐、旅游、餐饮等行业与渔业结合为一体,提高了渔业的社会、经济和生态效益,并逐步成为现代渔业的一个支柱产业,市场前景十分广阔。
天眼查研究院认为,随着户外休闲运动的持续火热,垂钓作为其重要的组成部分吸引着越来越的爱好者参与其中。未来,垂钓产业将形成以“钓鱼”为核心,集合体育竞技、休闲娱乐、旅游观光、文化科普、住宿餐饮在内的多产业,形成立体产业结构。
本文源自金融界资讯
大模型=缸中之脑?通院朱松纯团队剖析AGI关键缺失
机器之心专栏
机器之心编辑部
“知行合一”:大语言模型距离通用人工智能最欠缺的一步
近期 ChatGPT/GPT-4 系列产品引发全球关注和讨论,以其为代表的大模型在语言方面表现出了一定的通用性,使通用人工智能的概念浮出水面,进入了大众视野。
业界很多人认为大模型是通往通用人工智能的必经之路,然而大模型真的如业界所追捧的一样 “无所不能” 么?以 GPT-4 为代表的大语言模型究竟离通用人工智能还有多远?
北京通用人工智能研究院朱松纯教授团队最新发布了一份针对大模型的技术报告,系统回顾了现有使用标准化测试和能力基准对大型语言模型(LLMs)进行的评估,并指出了当前评估方法中存在的几个问题,这些问题往往会夸大 LLMs 的能力。报告进一步提出通用人工智能(AGI)应具备的四个特征:能够执行无限任务,自主生成新任务,由价值系统驱动,以及拥有反映真实世界的世界模型。
研究人员在技术报告中指出,“知行合一”(认识和行动的内在统一)是大模型目前所欠缺的机制,也是迈向通用人工智能的必经之路。研究人员认为,概念的学习依赖于与真实世界的交互,且知识的获取并不完全依赖于被动输入,在新环境中获取知识的关键途径更应该是主动探索和试错而非被动接受。
论文链接:
一、大语言模型无异于缸中之脑
缸中之脑是由哲学家 Hilary Putnam 提出的一个著名思想实验,该实验假设人的大脑从身体剥离,放在一个能够维持其机能的营养液缸,由一个超级计算机联结大脑神经元制造出各种幻象,让人觉得一切正常,就像《黑客帝国》所演的那样,那我们该怎么知道自己不是缸中之脑呢?
基于语义学的分析,Putnam 反驳道,当缸中大脑里的人声称自己是 “缸中之脑” 时,缸和脑的所指已经发生了变化。如何理解这一观点呢?举个简单的例子 —— 假设存在一个孪生地球,其居民和我们生活方式、语言均相同,但他们的 "水" 分子组成为 XYZ,与我们的 H2O 不同。尽管这两种 "水" 在外观、用途和名称上无异,且两地居民对 "水" 的心理感知相同,但指向的实质却不同,因此其含义也应有所区别。这也启发研究者从符号落地(symbol grounding)的视角看待大模型。论文认为,大模型无异于缸中之脑,因为大模型本身并不在真实世界中 (living in the world),它无法像人一样实现从” 词语 (word)“到” 世界 (world)“的联结。这一点是由它的内在构造机制所决定的 —— 通过统计建模在大量文本上进行训练,学习文本之间的语言学相关关系,从而根据上个词汇预测下个词汇。
缺乏符号落地使得大模型很容易陷入绕圈圈的境地。研究者尝试给 GPT-4 一个引子,让它跟自己对话,然而在有限回合之后,GPT 就开始重复自己说的话,无法跳脱当下的语义空间。
大模型的 “智能” 与其说是内在的,不如说是人类智能的投影。大模型生成的文本并不先天具有意义,其意义来自于人类用户对于文本的阐释。例如语言学家乔姆斯基曾经尝试挑战语言学界构造了一个符合语法规范但无意义的句子 ——“无色的绿思狂暴地沉睡”(“Colorless green ideas sleep furiously”),然而中国语言学之父赵元任在他的名文《从胡说中寻找意义》中给予了这个句子一个充满哲思的阐释。
二、大模型的局限性
大模型训练数据集的不透明以及人类评估时所采取的指标差异可能使得人类高估了大模型的真正表现。一方面,大模型的训练数据集通常是规模巨大且高度易得的互联网数据,这些训练数据可能会包含后续用于评估的数据集。由于当前我们并不知道 GPT-4 等大模型的训练数据集构成,泛化这一概念变得模糊,即我们无法判断大模型是真的学习到了核心概念,还是仅仅从它的训练产生的 “隐藏记忆” 中进行检索,这种不透明性阻碍了学术界对其公正和可靠的评估。另一方面,有研究发现大模型的涌现能力并非源于模型行为的本质变化,而是由于使用的评估指标导致大模型看起来突然变得很强大。简单地说,在使用非线性度量(如 X 的 n 次方)时,曲线上稀疏的采样点可能让人感觉到存在某种涌现现象,然而如果换成线性度量,这种现象就不存在了。
在回顾了数十篇大语言模型的评估研究后,研究人员发现:
1)虽然某些研究声称大语言模型能够在标准化测试(SAT,LSAT)中取得超越普通人类考生的卓越成绩,但一旦引入非英语的其他语言同类型测试,比如中国高考、印度升学考试、越南高考时,GPT 的表现显著下降,且其在需要应用推理的考试(数学、物理等)的成绩显著低于强语言依赖学科(英文、历史)的考试。GPT 的表现看上去更像是采取了一种题海战术,通过重复的记忆来做题,而非习得了如何进行推理。
2) 大语言模型的数学推理能力仍然有待提高。Bubeck 等人(2023)在《Sparks of Artificial General Intelligence》这篇文章中采取了单个案例展示的方式尝试说明 GPT-4 能够解决 IMO 级别的问题,但研究者在仔细检视了 GPT 所提供的解决方案发现 Bubeck 等人的结论具有很强的误导性,因为测试的题目被极大程度地简化了,在让 GPT-4 解决 IMO 数学题原题时, GPT-4 的数学逻辑链条是完全错误的。另有研究发现,在 MATH 训练数据集上,即使把模型设置为 MathChat 的模式,其准确率也只有 40% 左右。
3)大语言模型的推理与其说是来自于理解逻辑关系,不如说是来自于大量文本的相关性。朱松纯团队的另一篇研究发现,一旦将自然语言替换为符号,大语言模型在归纳、演绎、溯因任务上表现骤降,无论是否使用思维链(thought of chain)的策略。
一个简单的例子如下图所示:图左用动物(熊、狗、牛等)生成了一系列陈述(比如 “熊喜欢狗”、“牛的属性是圆”、“如果某个动物的属性是圆,那么他们喜欢松鼠”),而后给 GPT-4 一个新的陈述(比如 “牛喜欢松鼠”)让其判断正确与否,研究者发现当把具有明确语义的词汇替换成抽象符号时,(比如用 e4 替代熊,e5 替代狗,e2 替代圆),大语言模型的表现将会显著下降。另一个对大模型的因果推断能力的研究揭露了相似的发现 —— 当将大模型的语义转化为符号时,大模型的表现将下降到几乎同随机回答无异,哪怕在微调之后,大模型也只能应对之前出现过的类似的符号表达,而无法泛化到新场景中。
4)大模型做不好抽象推理,当面对那些仅依赖于几个小样本演示从而找到潜在规律的任务时,大模型的表现较为一般。如下图所示,在瑞文测试数据集(RAVEN) 中,测试者需要根据已有的 8 个图形(形状、颜色、数量、大小)寻找暗含的规律,然后推理出最后一个图形。
另外一个例子来自于 Evals-P 数据集,如下右图所示,大模型需要能够在缺少大量训练样本的前提下找到出现 foo 或者 bar 的规律,即当首字母包含在之后的字符串里时是 foo,不包含时为 bar。对于某些大模型,这些任务的准确率接近于 0,而哪怕 GPT-4 的准确率也只有 30% 左右。
三、关于通用人工智能的一种观点
判断 “某某某 AI” 是不是通用人工智能的一个前提是得清楚通用人工智能的定义或者基本特征,朱松纯团队尝试刻画出了通用人工智能(AGI)的四个特征:
1.能够执行无限的任务;
2.能够自主生成新任务;
3.由价值系统驱动;
4.拥有反映真实世界的世界模型。
首先,智能体应具备在物理和社会环境中完成无穷任务的能力。如果设定一个表示达到 AGI 的任务数量阈值,那么如何确定这个阈值将始终是一个值得质疑的问题。如果智能体在完成 N 个任务后没有展现出通用智能,我们就没有理由相信它在完成第 N+1 个任务后会突然拥有通用智能。虽然一系列具体而具挑战性的任务清单对于评估智能体的性能有所帮助,类似于教师用学生的考试分数来评估他们的学习成绩,但仅仅完成具体任务并不等同于拥有通用智能,这就像不能仅凭学生的分数判断他们真正的学习能力一样。此外,无穷任务并不意味着智能体需要像超人一样无所不能,而是指通用智能体应能够在特定环境中自主生成新的任务,这与学生学会自我学习相仿。
智能体生成新任务需要两个基本机制。首先,智能体需要一个驱动任务生成的引擎。例如,达尔文的进化论揭示出生存和繁衍这两个本能,它们被编码在我们的基因中,而人类的进化过程丰富了价值系统,出现了各种各样的细分价值,如利他主义、诚实和勇气等,每个人都受到一个由其与现实世界持续互动塑造的复杂价值系统的驱动。同样的,我们可以应用这种价值系统的概念来构建通用智能体,在这种情况下,人类可以通过调整智能体的价值函数来影响其行为,而无需预先定义详细的任务步骤。其次,智能体需要一个包含真实世界中物理法则和社会规范的世界模型,来指导智能体和真实世界的交互。这就像一个玩乐高,世界模型包含了各种积木(物体表征)以及积木之间的连接方式(物理法则和因果链等)。然而,价值函数在所有可能的选项中选择了一种蓝图,比如拼一个城堡,驱动智能体去执行任务,在乐高城堡搭建的过程中,智能体需要根据当前的进度,选择合适的积木并将其正确地放置在相应的位置(自我生成新任务)。
四、“知行合一”
王阳明曾说,知而不行,只是未知。为了解决符号落地并且诞生具有上述特征的通用人工智能,仅依赖于知识是远远不够的,整合知识和行动是必须的。此时,智能体不仅能够通过主动地行动来生成对于现实世界物体的更加完整的表征,比如整合了视觉、触觉、听觉等信号,更重要的是能够通过探索环境生成知识,并进一步泛化到新场景中。
其一,人对于世界的理解是建立在和真实世界交互中的。符号(语言、数学符号等)只是概念的指针,只有多模态的交互信号才能真正建立概念表征。仅停留在文本空间上的大语言模型虽然能够生成符号,但无法实现理解符号所指向的概念。如同一个蚂蚁意外的行动轨迹构成了一个 “○”,但蚂蚁本身并不理解圆形意味着什么。
其二,知识并非是先天存在的,知识和行动之间有着内在的联系。人类对世界的深刻理解并非来自于简单地阅读手册,而是通过自己亲身探索或者来自于他人探索的传递等反复的试错积累而来。在这里,知识体现了人与世界交互的能力(比如推理,问题解决,社会理解),但如果模型只是被动地接受知识并通过统计模型生成内容,无异于一个压缩了大量知识的百科全书,但却无法在新环境中通过探索世界进行新的知识生产( 包括知识抽象、知识积累和知识迁移等过程)。
五、总结
研究团队提出的大模型技术报告为接下来的人工智能研究提供了一些潜在的研究方向:
建立透明的评估机制和评估系统;创造具有丰富可供性(大量交互可能性)的仿真环境;探索一套 “知行合一” 的认知架构,从 “纯数据驱动” 的范式向 “任务驱动” 的范式转变。