数据分析:对历史规律的展示、对将来数据的预测。html
机器学习:机器学习是指从一系列的原始数据中找到规律,提取人们能够识别的特征,而后经过学习这些特征,最终产生一个模型。java
流程:原始数据-->特征提取-->模型。机器学习偏向于算法。算法
人工智能:Artificial Intelligence, AI,亦称机器智能,是指利用计算机来对人的意识、思惟信息过程、智能行为进行模拟(如学习、 推理、 思考、 规划等)和延伸,使计算机能实现更高层次的应用。人工智能基于机器学习偏向于应用。数据库
数据挖掘:综合运用机器学习和人工智能技术来解决生产或生活中的问题,是一个过程,一个解决方案。安全
基础层(基础资源):微信
计算资源:学习数据的过程,若是资源不足将致使训练时间很是的漫长。网络
数据资源:数据要保证可靠、充分、准确架构
技术层:算法、算法底层支撑的框架、算法运行环境、友好的建模界面框架
应用层:人工智能只是一种技术,不是一个行业,须要和各个行业进行结合,才能发挥价值。所以须要懂技术,还要懂业务。机器学习
从整我的工智能项目要经历的阶段来看
基础层:数据收集-->数据理解-->数据处理-->
技术层:特征提取-->模型构建-->模型评估-->模型训练-->
应用层:模型应用
机器视觉:将被摄目标的形态信息、像素分布和亮度、颜色等信息,转变成数字化图像信号,传送给图形处理系统;好比手机的AI摄像头对照片进行美化。
生物识别:经过计算机,与光学、声学、生物传感器、统计学的概念手段结合,利用人体固有的身体特征、行为特征进行我的身份的鉴定。好比人脸、指纹、虹膜等。通常将特征分为两类:静态特征 和 行为特征(或动态特征)
专家系统:模拟人类专家解决领域问题的系统。数据库里包含含有大量的某个领域专家水平的知识与经验,跟进用户的咨询,进行推理和判断,模拟人类专家的决策过程。好比智能客服,可以进行自我学习,天猫双11 80%以上是智能客服完成的。好比券商的智能投顾。
编码遗传:AI系统利用遗传算法和图灵完备语言开发的程序理论上可以完成任何类型的任务。好比基因改造、基因测序,这一块属于较敏感的话题。
机器人学:机器人是一个综合性的人工智能产品。应用机器的视觉触觉听觉等技术、机器人语言和智能控制软件等,来承担危险的事务。好比能够参与到人不可触及、高危的场景
举例:生物识别的通用流程
人工智能的核心是机器学习,机器学习的核心是算法。常见的算法能够分为两大阵营:
一、传统的机器学习算法:主要解决一些简单的应用场景以及结构化的数据。
二、非传统的机器学习算法:主要解决一些比较复杂的应用场景以及非结构化的数据或者多样化的数据。
常见的算法:
有监督学习:有feture和label;业务系统提供的数据源知道缘由又知道结果,根据缘由找结果,此时称之为有监督的学习,
非监督学习:只有feture;业务系统提供的数据源不知道会产生什么结果,此时称之为非监督的学习。 百度百科:指在没有类别信息状况下,经过对所研究对象的大量样本的数据分析实现对样本分类的一种数据处理方法。
半监督学习:二者的结合。
分类算法:看label的类型。若是label离散型变量,二分类/多分类。 好比线性回归算法
回归算法:连续性变量,好比预测股票价格、交通流量等。好比逻辑回归、决策树、朴素贝叶斯、支持向量机。
随机森林、K-近邻、神经网络便可作回归,也可作分类。
强化学习:根据环境来调整学习xiao,反馈机制,每一阶段其实仍是传统算法
房子有不少的属性,好比面积、楼层、朝向、学区、交通是否便利等等。利用机器学习,基于已经卖掉的房子数据能够训练出一个房价和房子众多属性之间的关联函数,之后在房子估价时只须要输入参数到模型中,就能够输出房子能够卖多少钱。这是一个典型的机器学习的回归模型的应用。
根据你每次买苹果的口味进行决策,最终选出最适合你的口味,这属于二分类问题,这是一个典型的机器学习决策树模型的应用。
本章节从业务沟通与业务目标确认、业务问题转换为机器学习问题、常规建模流程、模型/业务解释四个方面进行说明。
甲方:对本身的业务比较了解,但建模水平可能还达不到企业的自身要求。
乙方:建模技术、建模经验比较充分,具备必定的业务,但还须要和甲方进行深刻沟通。
注意:在项目过程当中,任什么时候候都要注意数据安全和数据隐私。
建模不是调算法,而是须要从业务自己出发,最终目的是为了业务提高。
数据与目标:有哪些数据?想作什么?以前是怎么作的?以前结果有什么不满意?
作法与思路:能不能用机器学习方法来作?如何转换为机器学习问题以及优先级?
应用于评估:训练出来的模型怎么用?指望达到什么样的效果(业务角度的效果)?
在用人工智能技术解决真实业务问题以前,须要思考:
沟通需求与业务目标
明确是不是机器学习的范畴以及是哪一种问题
明确人工智能建模流程
预设各阶段的开发周期和检验标准
肯定最终模型使用方式
明确最终模型的效果评估方式
阶段概要说明:
数据收集:ETL
数据理解:数据表明业务
数据处理:数据的准确性、数据的质量。
特征提取:两种方式。一:基于人对业务经验的了解,可能存在人为因素。二:用一些神经网络的方法,基于数据自己的特征进行加工和特征提取,但只能提取通用的规律。各有利弊
模型构建:选择算法
模型评估:评估模型、优化模型。
模型最终是否能产生价值,还须要业务推进、调整,所以须要和业务进行充分、反复的沟通,确认目标、确认作工做的方式和效果。
最终必定要转化为业务语言,指导业务。
微软 主要 研究大数据(城市计算)、智慧医疗、知识图谱(微软认知服务),NLP(机器翻译、实时语音翻译、微软小英、微软小冰),计算机视觉等领域。
百度研究院 下设 深度学习实验室(IDL)、大数据实验室(BDL)、硅谷人工智能实验室(SVAIL)、商业智能实验室(BIL)、机器人与自动驾驶实验室(RAL)、认知计算实验室(CCL)、量子计算研究所(IQC);多模态深度语义理解的百度大脑3.0,Apollo平台;
腾讯AI实验室 游戏类AI,围棋AI(绝艺)、王者荣耀AI(绝悟)等
华为诺亚方舟实验室 计算机视觉、推荐与搜索、AI基础理论、语音和语言处理、决策与推理等
阿里巴巴达摩院 分为机器智能、数据计算、机器人、金融科技、X实验室共5大研究领域,14个实验室。产品:人工智能芯片平头哥。
一、深度神经网络:解开神经网络的工做原理
二、模糊计算:以模糊集理论为基础,它能够模拟人脑非精确、非线性的信息处理能力
三、强化深度学习:与环境交互以解决业务问题
四、生成对抗网络:配对神经网络刺激学习,减轻处理负担
五、混合学习模式:模型融合,提升模型准确性
六、自动化机器学习:自动化建模、让AI更智能。
星环科技企业级人工智能平台SOPHON
目的:帮助企业用户以可视化方式实现人工智能的快速落地
功能:数据导入、数据预处理、特征工程、模型训练、模型验证、模型部署、模型应用等
产品优点:自动建模技术、全场景工具、优化的分布式算法、多数据融合、微服务部署、全流程图形化、多用户协做、流式机器学习、多种计算框架、工做流调度等。
5.1 基于关联分析的经典案例:沃尔玛的啤酒尿布
5.2 回归预测:好比新冠肺炎疫情的预测
5.3 知识图谱:好比超级传播者的识别
5.4 天然语言处理NP:好比垃圾邮件检测与分类
5.5 神经网络(深度学习):人脸识别VS猪脸识别
5.6 强化学习(深度学习):好比电子竞技-AI dota。AI选手训练量惊人,至关于天天可打200万局dota;256块GPU,12.8万个CPU核心
5.7 人工智能应用领域
欢迎关注个人我的公众号“码大叔”,也能够加个人我的微信:qiaojs,咱们一块儿java相关的交流学习!
本文是我观看星环科技AI工程师公开培训视频的学习笔记,拿出来和你们一块儿分享学习,版权归星环科技全部。你们也能够直接去观看视频,老师讲的更为详细。
B站直播地址:https://live.bilibili.com/21878856,免费噢(星环科技最近不定时有不少大数据、云计算、人工智能相关的分享)
AI讲师:孙国库 星环科技AI架构师&金牌讲师
感谢星环科技孙老师的精彩分享!
原文出处:https://www.cnblogs.com/madashu/p/12572184.html