有效沟通问答-【官方】百战未来_IT在线教育培训机构

JAVA 全系列

Python全系列

职业规划/学习方法

AI驱动的Python编程

大模型应用入门

【AI理论】提示词工程：高效对话与优化技巧

【职场AI】AI在职场中的高效应用场景

【办公AI】DeepSeek接入办公工具实战

【工作流】Coze视频工作流

【Python入门】零基础快速掌握Python编程

【Java入门】从零开始学Java：基础到实践

【企业实战】如何在项目中集成智能聊天机器人

【AI社交】在微信中接入DeepSeek打造AI女友

【大模型框架】LangChain 与基于RAG构建医疗问答系统

【AI助手与数据可视化】Assistants 与 Streamlit

【大模型本地部署与微调】训练属于你的Deepseek

【编程探秘】解锁AI智能编程工具奥秘

【图像绘图】走进Midjourney图像AI绘图世界

【模绘解析】洞悉Stable Diffusion（自选模型）AI绘图原理

小龙虾OpenClaw

openclaw保姆级本地部署&云部署&编写skills

WEB前端全系列

大厂算法特训班

C++特训班

鸿蒙应用开发

大数据全系列

Hadoop 分布式计算MapReduce和资源管理Yarn

人工智能

人工智能基础-Python科学计算和可视化

微服务

SpringBoot与MybatisPlus

Spring Cloud Alibaba技术栈

租房网（Spring Cloud最新架构）

软件测试全系列

Java编程基础和Java Web开发基础

7u职场软实力

毕设项目

软考中级

软考初级

ROS2机器人开发

计算机考研408

百战万词考研英语

考研英语7000词汇精讲1（1-1000）

考研英语7000词汇精讲2（1000-2000）

考研英语7000词汇精讲3（2000-3000）

考研英语7000词汇精讲4（3000-4000）

考研英语7000词汇精讲5（4000-5000）

考研英语7000词汇精讲6（5000以上）

英文原版报刊选题：《经济学人》选题

英文原版报刊选题：《纽约时报》选题

英文原版报刊选题：《自然nature》选题

英文原版报刊选题：《时代周刊times》选题

英文原版教材：《柏拉图：理想国，西方哲学源头》

考研英语

考研政治

AI Agent智能体开发大厂孵化器

Hermes-Agent 自我进化的超级智能体

Vibe Coding实践

【进阶】数据科学与智能分析基础

【进阶】云原生开发环境与DevOps工具链

【进阶】大模型开发工具平台

【进阶】机器学习算法与工程实战

【进阶】深度学习框架与神经网络架构

【进阶】自然语言处理与Transformer架构

职场智能体赋能训练营

Hermes Agent自我进化的超级智能体

职场智能体快速开发训练营

会员可以在此提问，百战未来老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 135014个问题

时间排序推荐排序

老师我很困惑，请老师指点

人工智能/第二十八阶段：强化学习/Policy Gradient 策略梯度 1楼

老师整个代码没有表现出图中公式的用处呢？

人工智能/第二十八阶段：强化学习/Policy Gradient 策略梯度 2楼

老师，请问能推荐一些强化学习的教材吗？希望能够自己闲暇时看看书。

人工智能/第二十八阶段：强化学习/Q-Learning与SARSA算法 3楼

老师您好，请问能推荐一下强化学习的学习教材吗？

人工智能/第二十八阶段：强化学习/Q-Learning与SARSA算法 4楼

Pendulum的action的取值怎么就可以确定是一个符合N(μ，σ)的正态分布

人工智能/第二十八阶段：强化学习/Actor Critic (A3C) 5楼

neg_log_prob = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=all_act, labels=self.tf_acts)

使用这个交叉熵计算loss，在模型迭代的时候一直迭代学习到reward=9，奖励值就不变了

人工智能/第二十八阶段：强化学习/Policy Gradient 策略梯度 6楼

QLearn.RL_brain 这库怎么去安装

人工智能/第二十八阶段：强化学习/Q-Learning与SARSA算法 7楼

QLearn.RL_brain 这个库文件怎么安装？

人工智能/第二十八阶段：强化学习/Q-Learning与SARSA算法 8楼

关于

课程分类

百战未来微信公众号

百战未来微信小程序

同学您好