ACP人工智能认证笔记整理(超详细版)
有标签是有监督。KNN(k近邻算法、分类算法、机器学习算法)、随机森林,SVM(支持向量机、样本少,支持样本多、分类任务),k算法(分类算法)TextCNN(分类任务模型,用于话题分类)、决策树、PLS(偏最小二乘法、回归分析)、TextCNN(分类型任务模型、卷积神经网络、权值共享)。
监督学习、分类分析和回归分析都需要数据的标签信息作为模型训练过程的指导。
朴素贝叶斯是一种基于概率论的算法,在做决策 时要求分类器给出一个最优的类别猜测结果,同 时给出这个猜测的概率估计值;
无标签是无监督,谱聚类、主成分分析,聚类是无监督。K-means(算法易实现)
聚类算法:K均值(k-means基于划分)算法、K-Medoids算法、CLIQUE算法、OPTICS、 CURE、STRING、DBSCAN。
K-means算法迭代结束的准则:达到运行迭代的最大次数、新的中心点距离上次中心点的偏移量小于指定值、新的中心点与上一次中心点一致。
基于模型的聚类算法:COBWEB和神经网络算法等。
基于网格的聚类算法:
STING:基于网格多分辨率,将空间划分为方形单元,对应不同分辨率;
CURE:采用层次聚类的算法,选择基于质心和基于代表对象方法之间的中间策略;BIRCH
CLIQUE:结合网格和密度聚类的思想,子空间聚类处理大规模高维度数据;
WaveCluster:用小波分析使簇的边界变得更加清晰。
关键词提取是通过这些重要的词可以反映文本主 题或者中心思想。
无监督学习的方法:基于统计 的抽取方法、基于主题模型的抽取方法、基于图 论的抽取方法。
有监督学习的方法:机器学习方 法、深度学习方法。通过数据以及对应的标签信息 进行不断调试建模的
Sigmoid函数也叫Logistic函数,用于隐层神经元输出,取值范围为(0,1),它可以将一个实数映射到(0,1)的区间,可以用来做二分类。
DBScan算法需要二个参数: 扫描半径 (eps)和最小包含点数(minPts)
深度学习框架组件建模流程:创建项目开通GPU----数据准备----构建运行试验----查看日志。
机器学习建模流程:数据处理----特征工程----模型训练----模型评估优化。
数据准备是机器学习中重要环节,PCA是一种常见数据分析方式,在数据处理过程中高维数据降维,提取数据中主要特征成分。
在现有的机器学习中,不同任务建立不同模型进行解决,解决数据特征学习使用卷积神经网络。
阿里云机器学习平台底层支持的计算框架:流式计算框架Flink;
基于开源版本深度优化的深度学习框架 TensorFlow;千亿特征样本的大规模并行计算框 架Parameter Server;Spark、PySpark、 MapReduce等业内主流开源框架。
PAI-DSW实例创建和使用过程:创建实例----进入开发环境----创建/打开Notebook ----模型开发训练
PAI-DSW开发环境中,对OSS进行数据读写的方式主要有: OSS Python SDK、TensorFlow OSS、OSS PYthon API。
PAI-DSW适用一般算法开发者,通过编程语言借助开发工具能够编写模型。支持多源数据接入,包括MaxCompute、OSS和NAS。预置常用大数据开发包和算法库,且支持自定义安装第三方库。
DSW关于Maxcompute的服务,无法使用VPC地址调用。
PAI-DSW交互式建模可以实现机器学习算法开发。选择数据存储:阿里云对象存储 (OSS)或阿里云文件存储(NAS)。
在PAI-DSW产品中,数据要上传到OSS上,可借助的常用工具有ossbrowser、ossutil、ossftp。
PAI-DSW是款云端机器学习开发IDE,提供交互式编程环境,适用于不同阶段的开发者并且集 成了开源Jupyterlab,以插件化的形式进行深度定 制开发,无需任何运维配置,即可在Notebook进 行编写,调试及运行Python代码。支持开源框架的安装,并提供阿里巴巴深度优化的Tensorflow框架。
PAI-DLC(云原生深度学习模型)支持数据并行、模型并行、混合并行的多种分布式方案。
PAI-EAS模型服务调用方式主要包括:公网地址调用、VPC地址调用、VPC高速直连。
PAI-EAS提供的弹性扩缩容和蓝绿部署等功能,可以支撑您以较低的资源成本获取高并发且稳定的在线算法模型服务。
同时,PAI-EAS还提供了资源组管理、版本控制及资源监控等功能,便于将模型服务应用于业务。
阿里云机器学习PAI-EAS在线模型服务的使用前提是已获得训练好的模型
通过PAI-EAS,您可以将模型快速部署为RESTful API,再通过HTTP请求的方式调用该服务。
PAI-Studio(可视化建模:拖拽组建方式建模)一键部署主要有两种方式:模型在线部署、实验离线调度。
使用PAI-Studio进行模型训练,要把训练收入分为低、中、高三挡,可以使用特征离散组件来实现。
PAI-Studio可视化建模的K均值聚类组件建模时,组件的配置选项:特征列、附加列、聚类数、初始随机种子(默认值)。
在PAI-Studio可视化建模中,相关系数算法用于计算一个矩阵中每列之间的相关系数,取值范围是[-1,1]。系统计算时,count数按两类间同时非空的元素个数计算,两列之间可能不同。使用深度学习组件时,需要使用GPU加速,提高模型训练速 度。
逻辑回归二分类组件:支持稀疏和稠密数据格式。
二分类组件的输出应该接混淆矩阵做分类效果评估。
通过数据视图组件,可以可视化的了解特征与标签列的分布情况及特征特点,以便进行数据分析,该组件支持稀疏和稠密数据格式。
混淆矩阵和二分类评估可以有F1指标、精准率、 召回率和AUC值,但是在阿里云机器学习平台PAI 的PAI-Studio中混淆矩阵组件和二分类评估组件都 有展示是F1指标。
PAI-Designer可视化建模支持大规模分布式的传统机器学习、深度学习、强化学习训练;支持流批一体训练;封装上百种机器学习算法,拖拽式建模,自动调参。基于云原生架构 Pipeline Service(PAIFlow)的可视化建模工 具, 提供可视化的机器学习开发环境,实现低门 槛开发人工智能服务。同时,系统提供丰富且成 熟的机器学习算法,覆盖商品推荐、金融风控及 广告预测等场景。
PAI-Designer(原PAI-Studio)提供的拆分算法。拆分是对数据进行随机拆分,用于生成训练和测试集
PAI命令方式的常见参数:
- inputTableName(输入表的名称)
- inputTablePartitions(输入表中,参与训练的分区)
- outputTableName(输出表名称列表)
- selectedColNames(输入表选择列名类型)
阿里云机器学习平台PAI支持使用两种数据存储格式,分别是MaxCompute和OSS存储数据,其中MaxCompute存储的是表结构数据,而OSS存储的结构化或非结构化数据,用于深度学习算法组件。
随机森林与Adaboost两者均归属于集成学习算法。
基于样本的迁移学习:根据一定的权重生成规则,对数据样本进行重用,来进行迁移学。
基于模型的迁移学习,常与深度神经网络进行结合。
基于特征的迁移学习:是识别出源领域与目标领域中含义相同或非常相近的特征或表征,然后利用这些特征进行知识迁移。(方法最稳定)
基于关系的迁移用的比较少,这个主要就是说挖掘和利用关系进行类比迁移,因此通过比较源领域和目标领域中样本之间的关系进行学习。
基于目标域样本的标签来对迁移学习算法进行划分----半监督迁移学习。
目标检测、图像分割、人脸检测都是需要确定位置信息的任务,不仅要给出相应的类别标签,还必须输出其相应的位置,而图像识别任务不需要确定目标的位置,只需要语义信息即可。
词形还原把关键词转化为其基本形式。
一个完整的PAI实验包括以下步骤:
1创建项目:PAI-Studio通过项目管理资源、权限及实验。您可以在每个项目中创建多个实验。
2准备数据:将原始数据上传至MaxCompute或OSS中,并配置实验数据源。 3数据预处理:对原始数据进行预处理,生成模型训练集和模型预测集。
4数据可视化:对实验数据进行可视化处理,获取数据信息。
5算法建模:对模型训练集进行算法建模,生成训练模型。
6评估模型:对模型预测集使用训练模型进行预测,评估模型准确性。
图像API接口返回的Requestld类型是String,返回的是 请求ID
PAI-TF模型导出包括导出SaveModel通用模型、 保存和恢复检查点以及如何将TF模型部署到 EAS。
DOG算子是一种常用于灰度图像角点检测。
HOG算法的计算流程:归一化、计算梯度、求解 Cell特征、计算block特征、计算图像特征。
HOG描述符通过计算局部区域的梯度方向直方图来构成特征
HOG常用的任务场景是行人检测。
二分类组件的输出应该接混淆矩阵做分类效果评估。
RNN能有效从序列数据中提取特征。(深度学习算法)
RCNN算法使用的分类算法是SVM。
Faster R-CNN算法的改进方法是一个两阶段的检 测算法,主要是使用了使用RPN (区域检测网络) 产生候选区域,在这其中主要是引入了anchor的 思想。
TextCNN网络中的卷积核是1维。
可视化方式:选择连续类型特征、选择枚举类型 特征、分层样本采用数。
在json、xml、pdf、jpg文件中只有json支持标注。
法庭庭审转写方案的优势有积累了大量司法方面的数据,转写效果佳;支持专有云部署;对于特殊关键词,如人名等,可以分庭做词表导入,以优化识别的准确率。
隐马尔科夫模型(HMM)是将分词作为字在字串 中的序列标注任务来实现的。
长短期记忆神经网络(LSTM)是一种特殊的RNN,为了解决长序列训练过程中的梯度消失和梯度爆炸;结构主要有输入门、遗忘门 和输出门三个门限函数组成。
电话业务服务采用的采样率是8000HZ。
个性化人声定制的试用周期是3个月。
在模型中引入Batch Normalization、增加dropout 和加入L1/L2正则项都能比较好的缓解模型的过拟 合问题;而减少网络层数只会加剧模型的过拟合 情况。
Caffe组件不支持自定义格式的训练数据,需要通过格式转换组件进行转换方可使用。格式转换组件的输入桩连接读OSS数据组件。
目前YOLO v3算法在速度和精度上保持的均衡性最好。
VGGNet证明使用很小的卷积(3∗3),增加网络 深度可以有效提升模型的效果,深层的网络对于 提取图像的语义信息具有更好的能力。
FastSpeech整个结构包含Feed-Forward Transformer,feed-forward transformer block,The Length regulator,the duration predictor。
只有BERT(Bidirectional Encoder Representations from Transformer)支持上下文建模。
对于较深的神经网络(DNN深度神经网络),神经网络的计算梯度从深 层往浅层进行传递时往往容易出现梯度消失问 题,因此影响浅层的模型训练。ResNet提出了残 差结构,可以将梯度信息直接通过残差结构传递 到浅层,避免了梯度消失问题。
训练求解GMM模型:用EM算法,不用最大似然 估计算法(单个高斯分布可用)。
离线调度功能是机器学习的常见场景,您需要通 过离线调度功能周期性地更新模型,帮助您构建 模型训练的Pipeline。机器学习支持与DataWorks 互通,实现机器学习实验的周期性调度。
增强学习又叫强化学习,是智能体(Agent)置于环境中,通过环境的反馈(奖赏惩罚)进行学习,是智慧体的累计收益最大。建模方法主要是根据环境的反馈不断调试的训练模型。
求解增强学习问题所使用的算法可分为策略搜索算法、值函数算法。
分析模式特征不仅在增强学习中使用,在常用的机器学习算法中都需要进行分析模式特征信息。比较训练集标签与模型输出结果在有监督学习模型中都需要进行该项。分析模型参数在机器学习算法中都需要进行的。
奖励:环境对智能体上一个行为的反馈。
值:智能体所期待的长期目标。
行为 (Action,A) : 智能体所能采取的所有可能的行为。
策略 (Policy,T) : 智能体更具当前状态来决定下 一步行为的方法。
Two-stage算法最显著的优点:模型精度高。
子账户创建的步骤:
- 进入阿里云官网,在管理控制台账户头像下,单机访问控制,创建和管理RAM用户;
- 在RAM访问控制页面,单击权限管理 >权限策略管理;
- 单击人员管理>用户,用户选择权 限策略配置权限。
One state 算法比two stage算法精度低的主要原因是因为
one state 算法不包含候选区域,会生成得到大量负样本,因此容易导致正负样本失衡,降低模型性能。
岭回归是当数据遭受多重共线性(独立变量高度相关)时使用的一种技术
岭回归通过收缩参数 λ(lambda)解决了多重共线性问题 线性回归:LInearRegression 容易出现过拟 岭回归通过回归估计中增加额外的偏差度,能够有效减少方差。(自变量个数多于样本量)
开通步骤:进入阿里云官网,注册阿里云账号;
在智能语音交互服务页面,单击立即开通;在产品开通页面,选择服务类型并选中服务协议,单击立即开通;登录Access Key管理页面,创建获取AccessKey和AccessKey Secret,调用智能语音服务。
机器翻译是通过递归神经网络(RNN)来实现的。
卷积神经网络CNN是深度学习模型算法
常用的机器学习算法组件有:二分类、多分类、 聚类、回归、评估、预测。
训练求解GMM模型使用的算法是EM模型。
Keras是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。
Roi Pooling的作用是适应各种尺度的输入候选区域。
语言
1、自然语言处理的数据主要是文本内容,主要是分析和挖掘文本内容。
2、基于词典的方法:基于匹配判断的方法、最大匹配法 (正向、逆向、双向)、全切分路径选择。
3、基于统计的方法:基于序列标注的方法、BMES表示法、HMM、CRF模型。
4、基于深度学习的方法:词向量预训练、CRF+ BiLSTM网络。
在使用深度学习框架训练数据之前,需要上传训练的数据至阿里云对象存储OSS中,算法在运行时从指定的OSS目录中读取数据。
- TF-IDF(关键词抽取方法)为TF与IDF的乘积,TF∗IDF值越大表示该 词在句中的重要性越大 其中:TF表示词频,通常 会被归一化 IDF表示反文档频率, IDF越大,则说 明该词具有越好的文档区分能力。
当词在文章出现次数越大,TF越大,说明越重要;
语料库文档中总数越大,越重要。
6、NLP平台的优势:接口易用、稳定可靠、功能全面、高效精准。
7、API返回参数的数据格 式有XML和JSON两种,可以在发送请求时指定返回的数据格式,默认为XML格式。
8、阿里云自然语言处理包括文本实体抽取、关键短语抽取、短文本匹配等项目。
9、中文NLP的基本流程由预料获取,预料预处理, 文本向量化,模型构建,模型训练和模型评价6部 分组成。
10、阿里云自然语言处理模块中的机器翻译在服务概况。
11、自然语言处理选择base模型包括平台智能模型、自建模型。
12、NLP自学习平台的数据标注任务可以进行查看、质检、下线操作。
13、阿里云自然语言处理中创建项目包括文本实体抽取、关键短语抽取、短文本匹配等项目类型。
14、阿里云自然语言处理NLP自学习平台数据集可以进行的操作:导出、编辑、复制。
15、可以对模型进行测试、查看、下线三种操作。
16、自然语言处理中,CNN更多的是使用在分类相关的模型任务中,适合使用卷积神经网络CNN来实现的语义分析、话题分类。
17、实体抽取任务的经典网络模型是CRF,LSTM-CRF等网络。词性标注任务则等价于求解整个文本的最优标签序列,两者都依赖于对文本的长期和短期依赖同时进行建模,更适合使用RNN实现。
18、使用阿里云自然语言处理NLP自学习平台预训练模型的前提条件有:开通阿里云自然语言处理、开通NLP自学习平台。文本实体抽取人物是阿里云自然语言处理服务可以提供的基础算法之一。
19、NLP自学习平台训练模型的过程和顺序:新建项目----上传数据集----创建模型----模型训练-----模型测试----模型调用。
20、NLP主要应用方向:机器翻译、文本分类、情感分析、自动文本摘要、自动问答、视觉问答。
语音
- 阿里云智能语音交互自学习平台的主要功能有热词训练功能,个性化人声定制功能和语言模型定制功能。
阿里云智能语音交互是基于语音识别、语音合成、自然语言理解等技术,为企业在多种应用场景下,赋予产品“能听”,“会说”,“懂你”的智能人机交互功能,智能语音交互适宜的场景有访谈录音转写、实时演讲字幕、智能质检。
2、 语音识别包括声学模型和语言模型,声学模型是把语音信号转换为音素;语言模型是把音素解码成句子。
语音识别是一个非常复杂的任务,主要包含五个关键步 骤:语音信号处理,特征提取,声学模型,语言 模型,解码搜索 。
3、音素是根据语音的自然属性划分出来的最小语音单位。汉语有32个音素。
4、录音文件时长不超过30分钟,识别不超过512MB大小的文 件。
文件识别支持的格式:WAV、MP3、AAC、OPUS。
5、语音识别处理过程主要包括:声学模型、语音模型、解码器。
6、阿里云智能语音交互的语音识别服务:录音文件识别、实时语音识别、一句话识别。
7、声码器GAN模型有生成器、判别器组成。对于声码器模型MelGAN模型是一种非自回归前馈卷积架构,用于 在GAN设置中执行音频波形生成。
属于神经声码器的:wavenet,waveglow,lpcnet。
传统声码器有straight-vocoder,world;
8、智能语音处理的主要任务:自然语言处理、语音识别、语音信号处理、语音合成、自然语音。
9、信号处理范畴有回声消除、语音增强。
语音信号处理的目的:1、理解语音是一种交流的手段 2、语音的传播和复制 3、对语音进行分析,以便自动识别和提取信息 4、发现说话者的一些生理特征。
语音信号处理:揭示语音信号的各种数学或实际性质、帮助解决基本问题和深层问题、将一种语音信号表示形式转化为另一中语音信号、智能语音交互基础。
10、参数法语音合成在训练阶段对语言声学特征、时 长信息进行上下文相关建模,在合成阶段通过时 长模型和声学模型预测声学特征参数,对声学特 征参数做后处理,最终通过声码器恢复语音波 形。
11、语音合成交互过程:鉴权、开始合成、接受合成数据、结束合成。
12、离线语音合成的参数有 Ak_id,ak_secret,app_key,sdk_code,device_id等。
13、语音合成支持的SDK:javaSDK、C++SDK、IOSSDK。
实时语音识别的采样位数16bit
14、语音合成涉及声学、语音学、数字信号处理、计算机科学等多个学科技术。语音合成技术一般由文本前处理/分析、声学建模 和声码器组成,而回声消除属于语音识别的前端 处理。语音合成意味着文字信息可以实时转化为标准流畅的语音朗读出来
15、常用语音数据编码:PCM、AMR。
16、语音定制工具使用步骤:关联项目,选择声音要应用到哪个项目中;手机端录制20句音频,并等待声音训练完成;试听效果,调用声音。
17、阿里云智能语音产品采用LFR解码技术,保证在1不损失识别精度的基础上讲解码速率提升3倍以上。
视觉智能
- 对图像人脸进行模糊处理----人脸信息脱敏
- 人脸检测与五官定位:识别图像中是否有人脸,进行人脸检测后返回检测到的人脸矩形框坐标
- 人物动漫化属于人脸识别任务中的人脸编辑类别。人脸识别主要包括三个环节:人脸定位、人脸属性识别、人脸比对。
- 窗口向一个方向移动没有引起灰度变化另一个方向有,说明处于边缘;向每个方向移动都有变化,说明处在角点。
- 像素与周围邻域内足够多的像素点相差较大,说明处于角点。
- 人脸属性识别可以在人脸检测基础上,识别各个检测人脸的性别(男/女)、年龄、表情(笑/不笑)、眼镜(戴/不戴)四种属性。
- 视觉智能平台开通流程为:成为开发者、能力调试、能力开通、创建AccessKey、启动开发。
- 人脸识别提供的能力:人脸美型、口罩人脸对比、五官编辑。
9、AI能力属于视觉智能得有文字识别、图像识别、视频搜索、商品理解。
10、阿里云图像搜索的服务内容包括商品图像检索、 通用图像检索、布料图像检索、商标图像检索四 种。
11、常见预处理类型有图像清理、几何变换、图像增强。缺失值补全是一种图像处理算法,不能用于预处理。
12、图像增强是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征。
13、传统图像提取方法基于图像本身特征:LBP、SIFI、HOG、Harris、Gabor。
16、视觉智能常见任务:图像识别、图像检索、图像分割、目标检测、文字识别、人脸检测识别。
17、视觉智能图像目标检测算法中,分为一阶段和二阶段的两大类算法,一阶段在速度方面比二阶段更快一些,YOLO是一阶段目标检测算法,R-CNN、Fast RCNN、Faster R-CNN 都是两阶段的目标检测算法。
18、视觉智能模拟训练中图像灰度化处理的常用算法有最大值法、平均值法。
19、图片搜索服务新增图片API方式必须项为:InstanceName(图像搜索实例名称)、 ProductId(商品ID)、PicName(图片名称)、PicContent(图片名称)。
20、图像识别系统可以根据捕获的图片进行分析,判断是哪种物体,使用阿里云提供的云产品进行存储,并对图片进行识别分类,需要的云产品有:阿里云大数据计算服务MaxCompute、机器学习PAI(识别分类)、对象存储服务OSS(存放图片数据)。
21、使用阿里云视觉智能开发平台进行公众人物识别,必须请求的参数Action、Task.N.ImageURL
多选
深度学习常用的开源框架有:TensorFlow , Caffe , Pytorch。
阿里云机器学习平台PAI中PAI-Studio可视化建模支持的深度学习框架:MXNet,TensorFlow(主推框架),Caffe。
阿里云机器学习平台PAI中PAI-Studio深度学习组件支持的深度学习框架:
TensorFlow、Caffe、MXNet及PyTorch。
阿里云机器学习平台PAI中PAI-DSW交互式建模提供的开发环境,支持的编程语言和框架:python2、python3、tensorfolw。
常用开源学习框架:Tensorflow、pytorch和mxnet。
TensorFlow架构是谷歌开源的第二代用于数字计算的软件库;主要是使用C++开发的,支持C、 Java、Python等多种语言的调用,目前主流的方 式通常使用Python语言来驱动应用。
阿里云视觉智能开放平台提供编程语言的SDK:Java、Node.js、python。
阿里云人工智能产品包含视觉智能、智能语音交互、文字识别、机器学习、自然语言处理、内容安全、机器翻译、产业智能。
典型的卷积神经网络由卷积层、池化层(不变性)、全连接层构成。
PAI-Designer支持模板工作流、自定义工作流两种方式构建工作流。
YOLO是一种基于深度神经网络的对象识别和定位算法,最大的特点是运行速度很快,泛化能力强,可以用于实时系统。
常见构建决策树模型的算法:ID3、CART。
一个自动问答系统可分为问句处理和信息检索两 大部分,其中问句处理包括:命名实体词典的构建、问题分析、问题分类和问题还原、答案生成。
随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于集成学习方法;随机森林是一种组合方式,有许多随机决策树组成,树与树之间无关联;随机森林对于高维数据集的处理能力令人兴奋,它可以处理成千上万的输入变量,并确定最重要的变量,随机森林可以处理高维数据。
逻辑回归算法优点:计算代价不高、速度快、适合二分类问题;模型易于理解和实现。
多项式回归的特点:(1)支持非线性拟合
(2)存在较大的过拟合风险
(3)是对应自变量的指数大于1的回归方程
麦克风阵列一般用于:声源定位,包括角度和距 离的测量;
抑制背景噪声、干扰、混响、回声;
信号提取;
信号分离。
特征生成操作:主成分分析、离散化、线性判别分析。
PAI平台支持单独和组合使用。
颜色空间包括:1.RGB空间;
2.CMY/CMYK颜色空间;
3.HSV/HSB颜色空间;
4.HSI/HSL颜色空间;
5.LAB颜色空间;
6.YUV/YCbCr颜色空间。
One-stage算法的特点:速度相对较快、能够学到物体泛化特征、端到端、适合移动端。
Word2vec包含 两种算法,分别是skip-gram和CBOW。
作为阿里云机器学习PAI-Studio的数据源的产品:大数据计算服务MaxCompute和对象存储服务OSS。
混淆矩阵(Confusion Matrix)适用于监督学习, 与无监督学习中的匹配矩阵对应。
PAI-Studio配置组件参数有:训练特征列,目标列,正则项,最大迭代次数(默认值)。
PAI-Studio实验的全局参数可以使用在SQL组件脚本、拆分组件的切分比例。
PAI Auto-Learning自动建模可以通过推荐召回、图片分类(最便捷建模)来实现。
多项式回归并不支持独立变量的自动筛选,需要预处理阶段完成。
二值化:所有数据非0就是1;将彩色图像转化为黑白图像;
卷积神经网络在空间上进行权值共享,循环神经 网络在时间步上的权值共享,而全连接神经网络 和神经元结构都不存在权值共享。
使用热词的场景:部分词汇默认识别效果不好、出现识别不好的网络流行语、出现陌生地名、出现新的业务专属名词。
题库易错对比图片
自己模拟轻松过,再小程序搜索考试宝,搜索人工智能ACP题库
学到东西哦,必过
刚考的本人都震惊哈哈哈哈哈哈哈哈,学吧这个笔记,必过