分享到:
电话:0371-61318821
助力企业快速实现 "互联网+" 计划

官方微信

郑州星云互联新闻中心,郑州星云互联资讯
首页 > 新闻中心 > 行业新闻

2022年五大数据科学趋势

上个世纪,数据科学作为一个研究和实际应用领域的出现导致了深度学习、自然语言处理和计算机视觉等技术的发展。从广义上讲,机器学习的出现使其成为我们所说的人工智能的一种工作方式,这一技术领域正在迅速改变我们的工作和生活方式。


数据科学包括理念的理论和实践应用,包括大数据、预测分析和人工智能。如果说数据是信息时代的油,而ML是引擎,那么数据科学就是数字领域的物理定律,它可以导致燃烧和活塞移动。


需要记住的一个关键点是,随着理解如何处理数据的重要性的增加,数据背后的科学变得越来越容易理解。十年前,它被认为是一门横跨统计、数学和计算的交叉学科,在少数几所大学教授。今天,它对商业世界的重要性已经确立,有许多途径,包括在线课程和在职培训,可以帮助我们应用这些原则。这导致了备受讨论的数据科学“民主化”,我们无疑将在2022年及以后看到这一趋势对下文提到的许多趋势的影响。


小数据与TinyML

我们正在生成、收集和分析的数字数据量的快速增长通常被称为大数据。然而,不仅仅是数据大——我们用来处理数据的ML算法也可能相当大。GPT-3是能够模拟人类语言的最大、最复杂的系统,由大约1750亿个参数组成。

如果您正在使用无限带宽的基于云的系统上工作,这很好,但这并不能涵盖ML能够增值的所有用例。这就是为什么“小数据”的概念已成为一种范式,在时间、带宽或能量消耗至关重要的情况下,促进对最重要数据的快速认知分析。它与边缘计算的概念密切相关。例如,当试图在紧急情况下避免交通碰撞时,自动驾驶汽车无法依靠从集中式云服务器发送和接收数据。TinyML指的是机器学习算法,其设计旨在占用尽可能少的空间,以便它们可以在低功耗硬件上运行,接近动作所在的位置。到2022年,我们将看到它出现在越来越多的嵌入式系统中——从可穿戴设备到家用电器、汽车、工业设备和农业机械,使它们变得更加智能和有用。


数据驱动的客户体验

这是关于企业如何利用我们的数据并使用它为我们提供越来越有价值或令人愉快的体验。这可能意味着减少电子商务中的摩擦和麻烦,在我们使用的软件中提供更友好的界面和前端,或者在我们进行客户服务联系时,减少搁置和在不同部门之间转移的时间。

我们与企业的互动正变得越来越数字化——从AI聊天机器人到亚马逊的无收银员便利店——这意味着我们参与的每一个方面都可以进行测量和分析,以了解如何使流程变得更加顺畅或更加愉快。这也促使企业为我们提供的商品和服务实现更高水平的个性化。例如,这场流行病引发了在线零售技术的投资和创新浪潮,因为企业希望取代实体购物旅行的亲身体验和触觉体验。寻找新的方法和策略,将这些客户数据转化为更好的客户服务和新的客户体验,将是2022年数据科学领域许多工作人员关注的焦点。


深度伪造、生成人工智能和合成数据

今年,当骇人听闻的真实视频“deepfake”走红时,我们中的许多人被欺骗,以为汤姆·克鲁斯已经开始在TikTok上发帖了。这背后的技术被称为生成人工智能,因为它旨在生成或创造一些现实中不存在的东西——在本例中,汤姆·克鲁斯用与米哈伊尔·戈尔巴乔夫会面的故事来款待我们。生成型人工智能很快就融入了艺术和娱乐业,我们在《爱尔兰人》中看到了马丁·斯科塞斯·德·阿格·罗伯特·德尼罗,在《曼达洛人》中看到了年轻的马克·哈米尔。

在2022年,我预计我们将看到它在许多其他行业和用例中爆发。例如,它被认为在为其他机器学习算法的训练创建合成数据方面具有巨大的潜力。可以创建从未存在过的人的合成脸来训练面部识别算法,同时避免使用真实人的脸所涉及的隐私问题。它可以用来训练图像识别系统,以便在医学图像中发现非常罕见和很少被拍摄到的癌症的迹象。它还可以用于创建语言到图像的功能,例如,允许建筑师通过简单地用文字描述建筑物的外观来生成建筑物的概念图像。


汇聚

人工智能、物联网(IoT)、云计算和5G等超高速网络是数字转型的基石,而数据是它们创造成果的燃料。所有这些技术都是单独存在的,但都是结合在一起的;它们使彼此能够做更多的事情。人工智能使物联网设备动作智能,相互交互,尽可能不需要人为干扰——推动自动化浪潮,创造智能家居和智能工厂,一直到智能城市。5G和其他超高速网络不仅仅允许以更高的速度传输数据;它们将使新类型的数据传输变得司空见惯(就像超高速宽带和3G使移动视频流成为日常现实一样),数据科学家创建的人工智能算法在这方面发挥着关键作用,从路由流量以确保最佳传输速度到云数据中心的自动化环境控制。到2022年,越来越多令人兴奋的数据科学工作将在这些变革性技术的交汇处进行,确保它们相互补充,并很好地发挥作用。


AutoML

AutoML是“自动机器学习”的缩写,是一种令人兴奋的趋势,它推动了本文导言中提到的数据科学的“民主化”。autoML解决方案的开发人员旨在创建任何人都可以用来创建自己的ML应用程序的工具和平台。特别是,它的目标是主题专家,他们的专业知识和见解使他们能够理想地为其特定领域中最紧迫的问题开发解决方案,但他们通常缺乏将AI应用于这些问题所需的编码知识。

通常,数据科学家的大部分时间将用于数据清理和准备——这些任务需要数据技能,而且往往是重复和平凡的。AutoML最基本的功能是实现这些任务的自动化,但它也越来越多地意味着建立模型、创建算法和神经网络。其目的是,任何人只要有需要解决的问题,或者有想要测试的想法,都能够通过简单、用户友好的界面应用机器学习,让人们看不到ML的内部工作原理,让他们自由地专注于解决方案。2022年很可能会看到我们离这一日常现实又近了一大步。



作者:作者:Bernard Marr 小晨编译 时间:2021-12-30 阅读:129 分享到: