强化学习中如何高效地与环境互动?如何从经验中高效学习?

论智 ? 2018-10-30 08:59 ? 次阅读

强化学习中很多重要的难题都围绕着两个问题:我们应该如何高效地与环境互动?如何从经验中高效学习?在这篇文章中,我想对最近的深度强化学习研究做一些调查,找到解决这两个问题的方法,其中主要会讲到三部分:

分层强化学习

记忆和预测建模

有模型和无模型方法的结合

首先我们快速回顾下DQN和A3C这两种方法,之后会深入到最近的几篇论文中,看看它们在这一领域做出了怎样的贡献。

回顾DQN和A3C/A2C

DeepMind的深度Q网络(DQN)是深度学习应用到强化学习中实现的第一个重大突破,它利用一个神经网络学习Q函数,来玩经典雅达利游戏,例如《乓》和《打砖块》,模型可以直接将原始的像素输入转化成动作。

从算法上来说,DQN直接依赖经典的Q学习技术。在Q学习中,动作对的Q值,或者说“质量”,是根据基于经验的迭代更新来估计的。从本质上说,在每个状态采取的行动,我们都能利用接收到的实时奖励和新状态的价值来更新原始状态动作对的价值估计。

除此之外,DeepMind的A3C(Asynchronous Advantage Actor Critic)和OpenAI的变体A2C,对actor-critic方法来说都是非常成功的深度学习方法。

Actor-critic方法结合了策略梯度方法和学习价值函数。只用DQN,我们只能得到学习价值函数(Q函数),我们跟随的“策略”也只是简单的在每一步将Q值达到最大的动作。有了A3C和其他actor-critic方法,我们学习两种不同的函数:策略(或者“演员”)和价值(或者“评委”)。基于当前估计的优点,策略会调整动作的概率,价值函数也会更新基于经验和奖励的优势。策略如下:

可以看到,降至网络学习了一个基准状态值V(si;θv),有了它我们可以将目前的奖励估计R和得到的优点相比较,策略网络会根据这些优点用经典强化算法调整对数几率。

A3C之所以这么受欢迎,主要原因是它结构的平行和不同步性,具体结构不是本文重点讨论的内容,感兴趣的读者可以查看DeepMind的IMPALA论文。

DQN和A3C/A2C都是强大的基准智能体,但遇到复杂问题时,它们并不那么好用,比如可能观察补全或者在动作和奖励信号之间有延迟。所以,强化学习领域的研究者们一直致力于解决这些问题。

分层强化学习

分层强化学习是强化学习方法的一种,它从策略的多个图层中学习,每一层都负责控制不同时间下的动作。策略的最下一层负责输出环境动作,上面几层可以完成其他抽象的目标。

为什么这种方法如此受欢迎呢?首先,从认知角度来看,长久以来的研究都表示,人类和动物的行为都是有组织的。例如,当我们想做饭的时候,我会把这一任务分成好几部分完成:洗菜、切菜、烧水煮面等等。我还可以把其中的某一小任务进行替换,比如把煮面换成蒸米饭,也能完成做好一顿饭的总任务。这就说明现实世界中的任务内部是有结构的。

从技术层面来说,分层强化学习能帮助解决上述提到的第二个问题,即如何从经验中高效地学习,解决方法就是通过长期信用分配和稀疏奖励信号。在分层强化学习中,由于低层次的策略是从高层次策略分布的任务所得到的内部奖励学习的,即使奖励稀疏,也可以学到其中的小任务。另外,高层次策略生成的时间抽象可以让我们的模型处理信用分配。

说到具体工作原理,实施分层强化学习的方法有很多。最近,谷歌大脑团队的一篇论文就采取了一种简易方法,他们的模型称为HIRO。

核心思想如下:我们有两个策略层,高层策略训练的目的是为了让环境奖励R实现最大化。每一步后,高层策略都会对新动作进行采样。低层策略训练的目的是为了采取环境行动,生成与给定的目标状态相似的状态。

训练低层策略时,HIRO用的是深度确定性策略梯度(DDPG)的变体,它的内部奖励是将目前得到的观察和目标观察之间的距离进行参数化:

DDPG是另一种开创新的深度强化学习算法,它将DQN的思想扩展到了持续动作空间中。他也是另一种actor-critic方法,使用策略梯度来优化策略。

不过,HIRO绝不是唯一的分层强化学习方法。FeUdal网络出现的时间更早,它将经过学习的“目标”表示作为输入,而不是原始状态的观察。另外还有很多方法需要一定程度的手动操作或领域知识,这就限制了其泛化能力。我个人比较喜欢的最近的一项研究成果是基于人口的训练(PBT),其中他们将内部奖励看作额外的超参数,PBT在训练时人口“增长”的过程中对这些超参数进行优化。

如今,分层强化学习是非常火热的研究对象,虽然它的核心是非常直观的,但它可扩展、多任务并行、能解决强化学习中的许多基础性问题。

存储和注意力

现在让我们谈谈另外能解决长期信用分配和稀疏奖励信号问题的方法。通俗点说,我们想知道智能体如何能擅长记忆。

深度学习中的记忆总是非常有趣,科学家们经历了千辛万苦,也很难找到一种结构能打败经过良好调校的LSTM。但是,人类的记忆机制可不像LSTM。当我们从家开车去超市时,回想的都是原来走过几百次的路线记忆,而不是怎么从伦敦的一个城市到另一个城市的路线。所以说,我们的记忆是根据情景可查询的,它取决于我们在哪里、在干什么,我们的大脑知道哪部分记忆对现在有用。

在深度学习中,Neural Turing Machine是外部、关键信息存储方面论文的标杆,这也是我最喜欢的论文之一,它提出通过向量值“读取”和“写入”特定位置,利用可区分的外部存储器对神经网络进行增强。如果把它用在强化学习上会怎样?这就是最近的MERLIN结构的思想。

MERLIN有两个组成部分:基于记忆的预测器(MBP)和一个策略网络。MBP负责将观察压缩成有用的、低维的“状态变量”,将它们直接储存在关键的记忆矩阵中。

整个过程如下:对输入观察进行编码,并将其输入到MLP中,输出结果被添加到先验分布中,生成后验分布。接着,后验分布经过采样,生成一个状态变量zt。接着,zt输入到MBP的LSTM网络中,输出结果用来更新先验,并且进行读取或书写。最后,策略网络运用z_t和读取输出生成一个动作。

关键细节在与,为了保证状态表示时有用的,MBP同样经过训练需要预测当前状态下的奖励,所以学习到的表示和目前的任务要相关。

不过,MERLIN并不是唯一使用外部存储器的深度强化学习网络,早在2016年,研究者就在一个记忆Q网络中运用了这一方法,来解决Minecraft中的迷宫问题。不过这种将存储用作预测模型的方法有一些神经科学上的阻碍。

MERLIN的基于存储的预测器对所有观察进行编码,将它们与内部先验结合,生成一个“状态变量”,可以捕捉到一些表示,并将这些状态存储到长期记忆中,让智能体在未来可以做出相应的动作。

智能体、世界模型和想象力

在传统强化学习中,我们可以做无模型学习,也可以做基于模型的学习。在无模型的强化学习中,我们学着将原始环境观察直接映射到某个值或动作上。在基于模型的强化学习中,我们首先会学习一个基于原始观察的过渡模型,然后用这个模型来选择动作。

能在模型上进行计划比单纯的试错法更高效,但是,学习一个好的模型通常很困难,所以早期很多深度强化学习的成功都是无模型的(例如DQN和A3C)。

这就表示,无模型和有模型的强化学习之间的界线很模糊。现在,一种新的“Imagination-augmented Agents”算法出现了,将这两种方法结合了起来。

在Imagination-Augmented Agents(I2A)中,最终策略是一个无模型模块和有模型模块并存的函数。有模型的模块可以看做智能体对环境的“想象”,其中包含了智能体内部想象的活动轨迹。但是,关键是有模型模块在终点处有一个编码器,它可以聚集想象轨迹,并将它们进行编译,让智能体在必要的时候忽略那些想象。所以,当智能体发现它的内部模型在进行无用或不精确的想象时,它可以学习忽略模型,用无模型部分继续工作。

I2A的工作流程

和A3C以及MERLIN类似,该策略也是通过一个标准策略梯度损失进行训练,如下:

I2A之所以如此受欢迎的原因之一是,在某些情况下,这也是我们在现实中处理情况的方法。我们总是根据所处的环境下,目前的精神想法对未来做计划和预测,但我们知道,我们的精神模型可能不完全准确,尤其是当我们来到一个陌生环境中时。在这种情况下,我们就会进行试错法,就像无模型方法一样,但同时我们还会利用这一段新体验对内在精神环境进行更新。

除此之外,还有很多研究结合了有模型和无模型两种方法,例如伯克利的Temporal Difference Model等,这些研究论文都有着相同目标,即达到像无模型方法一样的性能,同时具有和基于模型方法相同的高效采样率。

结语

深度强化学习模型非常难以训练,但是正是因为这样的难度,我们想到了如此多种的解决方案。这篇文章只是对深度强化学习的不完全调查,除了本文提到了方法,还有很多针对深度强化学习的解决方案。但是希望文中所提到的关于记忆、分层和想象的方法对该领域中所遇到的挑战和瓶颈有所帮助。最后,Happy RL hacking!

原文标题:除了DQN/A3C,还有哪些高级强化学习成果

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

C语言程序设计教程之指针使用的课件免费下载

本文档的主要内容详细介绍的是C语言程序设计教程之指针使用的课件免费下载指针使用主要内容 地址与指针....

发表于 11-16 17:47 ? 21次 阅读
C语言程序设计教程之指针使用的课件免费下载

C语言程序设计教程之结构和其它数据机制的资料概述

本文档的主要内容详细介绍的是C语言程序设计教程之结构和其它数据机制的资料概述主要内容包括了:1.结构....

发表于 11-16 17:47 ? 16次 阅读
C语言程序设计教程之结构和其它数据机制的资料概述

如何使用深度残差网络进行无人机航拍图像识别

为了有效提高无人机航拍图像的识别准确率,本文提出了一种基于深度残差网络的深度卷积神经网络模型。该模型....

发表于 11-16 17:17 ? 14次 阅读
如何使用深度残差网络进行无人机航拍图像识别

利用AI提高性能和降低功耗及重塑芯片的设计

随着架构师开始利用 AI 提高性能和降低功耗,并为未来芯片的开发、制造和更新奠定基础,人工智能也开始....

的头像 机器人博览 发表于 11-16 16:46 ? 205次 阅读
利用AI提高性能和降低功耗及重塑芯片的设计

简单的C程序设计教程之顺序程序设计的资料概述

本文档的主要内容详细介绍的是简单的C程序设计教程之顺序程序设计的资料概述。

发表于 11-16 16:17 ? 11次 阅读
简单的C程序设计教程之顺序程序设计的资料概述

机器学习中应用数学应该要注意的几点注记

本章讨论的主题是我觉得在应用机器学习(和其他地方)中经常假设的,但是很少详细解释。这项工作是针对学生....

发表于 11-16 16:17 ? 16次 阅读
机器学习中应用数学应该要注意的几点注记

图玛深维发布四款智能诊断新品,均采用深度学习和AI领域的最新方法

图玛深维医疗科技有限公司(以下简称图玛深维)发布了四款智能诊断新品——胸部X线智能诊断系统、乳腺钼靶....

的头像 机器人技术与应用 发表于 11-16 15:54 ? 112次 阅读
图玛深维发布四款智能诊断新品,均采用深度学习和AI领域的最新方法

使用信息熵抑制的轨迹来保护隐私方法资料概述

针对传统 高维轨迹隐私保护模型抑制点数过多而导致的数据匿名性差及数据损失大的问题,提出了一种基于信息....

发表于 11-16 15:37 ? 10次 阅读
使用信息熵抑制的轨迹来保护隐私方法资料概述

利用深度学习技术来从纷繁复杂的观测图像中识别和发现新的星系

研究人员表示,绝大多数情况下黑洞都会位于星系的中央,这些巨大的黑洞喷射出的射线可以被射电望远镜捕捉到....

的头像 将门创投 发表于 11-16 11:20 ? 254次 阅读
利用深度学习技术来从纷繁复杂的观测图像中识别和发现新的星系

如何面向K最近邻分类的遗传实例来选择算法

针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的....

发表于 11-16 11:16 ? 12次 阅读
如何面向K最近邻分类的遗传实例来选择算法

谷歌在医疗方面的雄心正在迅速形成

Feinberg将负责研究如何整合谷歌内部分散的医疗健康项目,这些项目在该公司旗下许多不同的业务部门....

的头像 新智元 发表于 11-16 10:43 ? 257次 阅读
谷歌在医疗方面的雄心正在迅速形成

如何使用情感分析和深度学习实现宏观经济预测方法

现代市场经济快速发展的同时也伴随着较高的风险,通过对地区投资情况提前预测,能够提前发现投资风险,为国....

发表于 11-16 10:41 ? 17次 阅读
如何使用情感分析和深度学习实现宏观经济预测方法

黄仁勋SC18激情演讲,高性能计算平台未来可期

关于HPC和GPU如何协同工作还有很多事情需要解决,至少近期,基于加速器的异构系统可以作为两者共同的....

的头像 新智元 发表于 11-16 10:31 ? 234次 阅读
黄仁勋SC18激情演讲,高性能计算平台未来可期

请教MemCopy函数的意义

请问     MemCopy(&RamfuncsLoadStart, &RamfuncsLoadEnd, &RamfuncsRunStart);     InitFl...

发表于 11-16 10:15 ? 28次 阅读
请教MemCopy函数的意义

自动驾驶进入寒冬?自动驾驶汽车在路上普及还要几十年

Waymo公司CEO John Krafcik本周二在WSJ D.Live技术大会上承认了自动驾驶道....

的头像 新智元 发表于 11-16 10:12 ? 260次 阅读
自动驾驶进入寒冬?自动驾驶汽车在路上普及还要几十年

索尼发布新的方法,在ImageNet数据集上224秒内成功训练了ResNet-50

近年来,许多研究人员提出了多种方案来解决这两个问题(见原文参考文献)。这些工作利用ImageNet/....

的头像 新智元 发表于 11-16 10:01 ? 194次 阅读
索尼发布新的方法,在ImageNet数据集上224秒内成功训练了ResNet-50

基于D-AlexNet和多特征映射的交通场景语义分割方法

基于视觉的交通场景语义分割在智能车辆中起着重要作用。

的头像 智车科技 发表于 11-16 09:47 ? 187次 阅读
基于D-AlexNet和多特征映射的交通场景语义分割方法

Tim Dettmers的最新测评结果,深度学习该选什么显卡?

为了让测评结果更严谨,小编顶着炼丹师朋友的40米长刀,在这里更新一下Tim Dettmers的最新测....

的头像 论智 发表于 11-16 09:13 ? 191次 阅读
Tim Dettmers的最新测评结果,深度学习该选什么显卡?

请问函数的调用和回调有何区别 ?

请教: 函数的调用 和 回调 有何区别 ? 谢谢!...

发表于 11-16 08:42 ? 63次 阅读
请问函数的调用和回调有何区别 ?

uCOS-III 常用函数参考手册详细资料免费下载

本文档的主要内容详细介绍的是uCOS-III 常用函数参考手册详细资料免费下载。

发表于 11-16 08:00 ? 13次 阅读
uCOS-III 常用函数参考手册详细资料免费下载

如何使用差异度建模方法来处理网络事件的热度演化

网络事件的热度演化研究是舆情监测的基础,而现有的网络事件热度研究方法主要是采用文本处理的方法对网络上....

发表于 11-15 16:44 ? 16次 阅读
如何使用差异度建模方法来处理网络事件的热度演化

多输入多输出一非正交多址接入系统融合用户调度的下行波束赋形设计

针对多输入多输出一非正交多址接入(MIMO-NOMA)技术中用户间干扰较大的问题,提出了一种融合用户....

发表于 11-15 16:20 ? 20次 阅读
多输入多输出一非正交多址接入系统融合用户调度的下行波束赋形设计

递归与动态规划:基础例题分析

题目描述 Description 下图给出了一个数字三角形,请编写一个程序,计算从顶至底的某处的一条....

的头像 算法与数据结构 发表于 11-15 16:01 ? 105次 阅读
递归与动态规划:基础例题分析

深度学习通往人类水平人工智能的挑战

2018年11月7日晚,被称为“深度学习三巨头”之一的蒙特利尔大学计算机科学与运算研究系教授Yosh....

的头像 人工智能学家 发表于 11-15 15:07 ? 179次 阅读
深度学习通往人类水平人工智能的挑战

怎么用Python玩GTA5?跟着教程玩!

好了,第一步,我们如何实现读取屏幕画面?我一直在想可以做,但还真没想过怎么做。所以,Google!我....

的头像 马哥Linux运维 发表于 11-15 12:55 ? 234次 阅读
怎么用Python玩GTA5?跟着教程玩!

如何对C语言程序进行优化

对程序进行优化,通常是指优化程序代码或程序执行速度。优化代码和优化速度实际上是一个予盾的统一,一般是....

发表于 11-15 11:08 ? 39次 阅读
如何对C语言程序进行优化

使用英特尔?至强?可扩展处理器和OpenVINO?工具包加快深度学习推理速度

除了精准医疗,越来越多的医疗机构都在使用深度学习推理来更快、更准确地查看患者的医学图像。同时,随着医....

的头像 知IN 发表于 11-15 11:07 ? 328次 阅读
使用英特尔?至强?可扩展处理器和OpenVINO?工具包加快深度学习推理速度

值得研究的四大机器学习策略分析

机器学习有四种广受认可的形式:监督式、无监督式、半监督式和强化式。在研究文献中,这些形式得到了深入的....

发表于 11-14 10:17 ? 40次 阅读
值得研究的四大机器学习策略分析

GitHub上25个最受欢迎的开源机器学习库

除了 TensorFlow 、Keras 和 Scikit-learn 之外,Apache 的 MX....

的头像 电子发烧友网工程师 发表于 11-14 09:23 ? 258次 阅读
GitHub上25个最受欢迎的开源机器学习库

谷歌大脑提出了一种简单的方法,用于将概率编程嵌入到深度学习生态系统

要在程序中指定随机选择,我们使用了Edward的RandomVariables。RandomVari....

的头像 新智元 发表于 11-14 09:15 ? 673次 阅读
谷歌大脑提出了一种简单的方法,用于将概率编程嵌入到深度学习生态系统

通信原理基础课程之通信基本的概念资料概述

本文档的主要内容详细介绍的是通信原理基础课程之通信基本的概念资料概述主要内容包括了:一、什么是通信?....

发表于 11-14 08:00 ? 22次 阅读
通信原理基础课程之通信基本的概念资料概述

街机游戏《街头霸王 3》中进行模拟来训练改进强化学习算法的工具包

实际上该工具包与模拟器本身不需要太多的交互,只需要查找和内部状态相关联的内存地址,同时用所选取的环境....

的头像 电子发烧友网工程师 发表于 11-13 09:30 ? 190次 阅读
街机游戏《街头霸王 3》中进行模拟来训练改进强化学习算法的工具包

递归指的是在函数的定义中使用函数自身的方法

C语言支持递归,即一个函数可以调用其自身。但在使用递归时,程序员需要注意定义一个从函数退出的条件,....

的头像 电子发烧友网工程师 发表于 11-12 15:06 ? 128次 阅读
递归指的是在函数的定义中使用函数自身的方法

C语言errno、perror()和strerror()

让我们来模拟一种错误情况,尝试打开一个不存在的文件。您可以使用多种方式来输出错误消息,在这里我们使用....

的头像 电子发烧友网工程师 发表于 11-12 15:01 ? 90次 阅读
C语言errno、perror()和strerror()

基于深度学习的人脸识别技术全解

全面解析人脸识别技术原理、领域人才情况、技术应用领域和发展趋势。

的头像 悟空智能科技 发表于 11-12 14:54 ? 2440次 阅读
基于深度学习的人脸识别技术全解

如何构建强化学习模型来训练无人车算法

本文作者通过简单的方式构建了强化学习模型来训练无人车算法,可以为初学者提供快速入门的经验。

的头像 智车科技 发表于 11-12 14:47 ? 151次 阅读
如何构建强化学习模型来训练无人车算法

C语言中的动态内存管理

但是,如果您预先不知道需要存储的文本长度,例如您向存储有关一个主题的详细描述。在这里,我们需要定义一....

的头像 电子发烧友网工程师 发表于 11-12 14:46 ? 99次 阅读
C语言中的动态内存管理

七大大咖嘉宾主题报告,指明AI发展新趋势

大会的第一位嘉宾是亚马逊资深主任科学家、Alexa&Echo 技术负责人 Nikko Strom,他....

的头像 电子发烧友网工程师 发表于 11-12 10:55 ? 498次 阅读
七大大咖嘉宾主题报告,指明AI发展新趋势

CSDN三倍速定律,透过技术社区看未来趋势

最近,我们针对一些AI Top公司做了一些调查报告,希望了解这些大公司的人才分布,公开论文的发表情况....

的头像 电子发烧友网工程师 发表于 11-12 10:51 ? 297次 阅读
CSDN三倍速定律,透过技术社区看未来趋势

10月最热的10篇AI相关文章

如果不避让就会撞上一群人,避让就会撞上另一个人,它应该避开人群吗?它应该保护乘客,还是保护行人?它应....

的头像 新智元 发表于 11-12 10:28 ? 279次 阅读
10月最热的10篇AI相关文章

专家告诉你中国如何成为AI头雁

那中国目前的AI发展有哪些短板需要补齐呢?杨静认为,中国在人工智能产业发展里存在“脚重头轻”症状,具....

的头像 新智元 发表于 11-12 10:25 ? 279次 阅读
专家告诉你中国如何成为AI头雁

在数据科学领域,真正的“全科专家”屈指可数

当我还在大学读书的时候,我写了一篇关于数据科学和建筑能源审计的长论文,这是我第一个真正意义上的数据科....

的头像 论智 发表于 11-12 09:42 ? 280次 阅读
在数据科学领域,真正的“全科专家”屈指可数

词对嵌入技术,可以改善现有模型在跨句推理上的表现

这种做法其实和词嵌入一脉相承。词嵌入同样面临计算所有上下文(softmax)过于复杂的问题。因此,w....

的头像 论智 发表于 11-12 09:38 ? 208次 阅读
词对嵌入技术,可以改善现有模型在跨句推理上的表现

如何用单独的GPU,在CIFAR-10图像分类数据集上高效地训练残差网络

现在我们假设在一个英伟达Volta V100 GPU上用100%的计算力,训练将需要多长时间。网络在....

的头像 论智 发表于 11-12 09:35 ? 246次 阅读
如何用单独的GPU,在CIFAR-10图像分类数据集上高效地训练残差网络

LED闪烁开发之while循环函数和delay延时函数的资料概述

本文档的主要内容详细介绍的是LED闪烁开发之C语言常用的预处理命令和while循环函数及delay延....

发表于 11-12 08:00 ? 33次 阅读
LED闪烁开发之while循环函数和delay延时函数的资料概述

关于机器学习的超全总结

根据训练数据是否有标记,机器学习任务大致分为两大类:监督学习和非监督学习,监督学习主要包括分类和回归....

的头像 将门创投 发表于 11-10 10:55 ? 361次 阅读
关于机器学习的超全总结

《深度学习500问》通过问答的形式对深度学习相关的各类热点问题进行梳理阐述

本章开始进入主题,为了描述神经网络,书中从最简单的神经网络说起,然后层层深入,列举了神经网络的常用模....

的头像 新智元 发表于 11-10 10:43 ? 387次 阅读
《深度学习500问》通过问答的形式对深度学习相关的各类热点问题进行梳理阐述

新书《解析深度学习:卷积神经网络原理与视觉实践》试读

我们知道,深度神经网络模型复杂的解空间中存在非常多的局部最优解,但经典批处理随机梯度下降法(mini....

的头像 新智元 发表于 11-10 10:23 ? 441次 阅读
新书《解析深度学习:卷积神经网络原理与视觉实践》试读

深度学习在可解释性推理方向上的进展

所以网络学习特征向量,和未见分类一起保存于可微记忆块之中。这一表示不断发展,给了神经网络学习“如何快....

的头像 论智 发表于 11-10 10:07 ? 466次 阅读
深度学习在可解释性推理方向上的进展

搭建了一款GIF动图生成器,其中使用的是OpenCV

ImageMagick是一个跨平台的、基于命令行的工具,能提供多种图片处理功能,例如只用一行指令就能....

的头像 论智 发表于 11-10 09:27 ? 208次 阅读
搭建了一款GIF动图生成器,其中使用的是OpenCV

申请数据科学家职位的经验分享

这里是一些例子:如果你需要参加一个MOOC课程学习一些基础,那很好。但不要陷入MOOC螺旋:MOOC....

的头像 论智 发表于 11-10 09:24 ? 225次 阅读
申请数据科学家职位的经验分享

关于STM32入门库函数的问题

我是直接记住这个函数的功能呢,还是去看这个函数的代码(即实现过程呢),小白,在这里请求大家指点...

发表于 11-09 08:55 ? 139次 阅读
关于STM32入门库函数的问题

数字电子技术复习试卷和答案资料免费下载

本文档的主要内容详细介绍的是数字电子技术复习试卷和答案资料免费下载 在每小题列出的四个备用选项中只....

发表于 11-09 08:00 ? 36次 阅读
数字电子技术复习试卷和答案资料免费下载

如何跳转到函数使用它的地址?

你好,先生, 现在我有一个问题,如何跳转到函数使用它的地址? 在我的项目中,我找到了映射文件中一个函数的地址。例如, 空...

发表于 11-05 14:34 ? 63次 阅读
如何跳转到函数使用它的地址?

*Alpha_State_Ptr()函数去分配任务有什么好处

   TI的很多例程中,会使用*Alpha_State_Ptr()函数去分配任务,这样做有什么好处呢?...

发表于 10-29 11:45 ? 176次 阅读
*Alpha_State_Ptr()函数去分配任务有什么好处

请问ccs5.5如何使函数名加粗

ccs5.5,在定义函数的时候函数名会加粗,但是在使用函数的时候怎么设置成加粗呢,谢谢...

发表于 10-10 11:12 ? 252次 阅读
请问ccs5.5如何使函数名加粗

FILEIO_Open语法问题

我很难理解如何使用FILIO搜索函数返回的值打开一个文件。下面是我正在做的一个剪辑。我知道这是“conchar *”,这是我的命,...

发表于 10-08 15:59 ? 63次 阅读
FILEIO_Open语法问题

请问LTspice中能否支持随机数函数如何实现

想在LTspice仿真中,把一个参数(比如电容值)设计为一个变量,这个变量在一定的范围内是一个随机数。如电容C的值为[20n,30n...

发表于 09-25 17:00 ? 74次 阅读
请问LTspice中能否支持随机数函数如何实现

audio HAL与kernel联动过程中关键的函数分析和总结

前言: 这篇文档主要是对audio HAL与kernel联动过程中几个关键的函数进行分析和总结: 1.select_device, 2.enable_sn...

发表于 09-25 15:44 ? 88次 阅读
audio HAL与kernel联动过程中关键的函数分析和总结

关于memcpy函数

memcpy(&RamfuncsRunStart, &RamfuncsLoadStart, (size_t)&RamfuncsLoadSize);这个应该放在main()函数中的哪个位置 ...

发表于 09-25 10:46 ? 110次 阅读
关于memcpy函数
a计划博彩 a计划博彩,连环夺宝注册送,唯品会注册送60元