第一部分 RL基础:什么是RL与MRP、MDP 1.1 入门强化学习所需掌握的基本概念 1.1.1 什么是强化学习:依据策略执行动作-感知状态-得到奖励 强化学习里面的概念、公式,相比ML/DL特别多,初学者刚学RL时,很容易被接连不断…
2025/2/1 7:00:23之前记录了 docker的安装 【环境配置】ubuntu中 Docker的安装; 本篇博客记录Dockerfile的示例,docker 的使用,包括镜像的构建、容器的启动、docker compose的使用等。 当安装好后,可查看docker的基本信息 docker info ## 查…
2025/1/29 11:05:13在ray.rllib中定义和使用自己的模型, 分为以下三个步骤: 1. 定义自己的模型。 2. 向ray注册自定义的模型 3. 在config中配置使用自定义的模型 环境配置: torch2.5.1 ray2.10.0 ray[rllib]2.10.0 ray[tune]2.10.0 ray[serve]2.10.0 numpy1.23.…
2025/1/29 10:00:101、关键词:帧数优化 2、上午收到一个平台的邮件,说欧盟DSA法案的事,然后联系客服解决问题。 3、近期测试中发现某些关卡帧数奇低,很是异常。 然后今天用了一天时间来排查、解决问题。 通过测试工具发现游戏逻辑部分耗时太多&…
2025/1/29 7:56:30MIIC-移动互联网创新大会全球移动互联网大会 GMIC世界互联网大会 中国物联网大会 GITC全球互联网技术大会转载于:https://www.cnblogs.com/YangBinChina/p/5095933.html
2025/2/1 12:49:49 人评论 次浏览/** * 给定一个double类型的浮点数base和int类型的整数exponent。求base的exponent次方 */ 注意 这里所说的exponent 可不单单是指正整数,还指负整数。 这里蹩脚的算法,网上还有其他的算法简单一点的,我也附上。 package Chap2; /*** 给…
2025/2/1 11:12:48 人评论 次浏览JsonSerialize(include JsonSerialize.Inclusion.NON_NULL) //保证序列化json的时候,如果是null的对象,key也会消失 public class ServerResponse<T> implements Serializable {JsonIgnore//使之不再json序列化结果当中public boolean isSuccess(…
2025/2/1 11:07:13 人评论 次浏览作者:天堂之门 http://ahk.5d6d.com/thread-447-1-1.html 在 控制面板>电源选项 中有个高级标签,这里的一个下拉列表中可以选择当你合上笔记本时是不采取任何措施还是待机或者休眠。此选项在我用外接的CRT显示器看电影时经常用到,因为我要…
2025/2/1 9:55:37 人评论 次浏览我们平时使用的Map,都是只能在Map中保存一个相同的Key,我们后面保存的相同的key都会将原来的key的值覆盖掉,如下面的例子。 package test62;import java.util.HashMap; import java.util.Map; import java.util.Map.Entry;public class test …
2025/2/1 13:53:14 人评论 次浏览通过试验,发现某种程度上已经理解了自己的问题。我之前被关于事务隔离级别错误信息误导,认为REPEATABLE-READ级别和SERIALIZABLE级别能解决丢失更新的问题,然而实际是不能的。因为mysql的select ... from table;语句 不管哪种隔离级别都是不会…
2025/2/1 13:52:44 人评论 次浏览为了同时对多个客户机进行服务,需要利用多线程。下面的程序样例,服务器与多个客户机进行交谈。对于每个客户服务,都使用一个线程(这里类名为Connection),线程的任务是接受客户机的字符并显示出来。 服务器程序…
2025/2/1 13:51:43 人评论 次浏览数据审计,英语表达是Audit,是追踪数据变化的过程,记录数据变化前后的值,供参考分析。通过设置,ERP可以追踪一个表的所有字段的变化,也可以只记录指定的字段的值变化。欧美企业每年都有独立的审计部门&#…
2025/2/1 13:50:12 人评论 次浏览【实例简介】【java实例】自己写的mysql数据库管理系统MANAGER_FOR_MYSQL_1_0的源代码详细请查看我的bloghttp://blog.csdn.net/wjlong0318/article/details/7982851【实例截图】【核心代码】372b61e6-2e75-449e-937e-9a609ffd37ff└── 毕业设计源程序├── img│ ├── …
2025/2/1 13:49:11 人评论 次浏览上一篇文章说了Ubuntu系统自动更新的配置,它适合于经常更新或者干脆不更新的情况,还有一种情况就是偶尔需要更新,也就是根据需要手工更新系统或软件包。 这有两种方法,一种是图形界面的方法,一种是命令行的方法。如果…
2025/2/1 13:48:41 人评论 次浏览前言:有些网站的登录方式跟前面讲的博客园和token登录会不一样,把csrfToken放到cookie里,登录前后cookie是没有任何变化的,这种情况下如何绕过前端的验证码登录呢?一、登录前后对比1.如果登录页面有图形验证码…
2025/2/1 10:59:06 人评论 次浏览装饰器是高阶函数,装饰器是对传入函数的功能增强。装饰器的副作用:原函数对象的属性都被替换了,而使用了装饰器,查看到的函数对象属性就变成装饰器的函数对象了,如果需要查被装饰的函数的属性?对用原函数的…
2025/2/1 10:58:36 人评论 次浏览一:输出一些观察信息 每隔10秒钟把一些关键信息显示在屏幕上; (1)当前在线人数; (2)和连接池有关:连接列表大小,空闲连接列表大小,将来释放的连接多少个; (3)当前时间队列大小 (4)收消息队…
2025/2/1 10:58:05 人评论 次浏览点击上方“Java基基”,选择“设为星标”做积极的人,而不是积极废人!每天 14:00 更新文章,每天掉亿点点头发...源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应用框…
2025/2/1 10:57:35 人评论 次浏览Wi-Fi理论带宽计算方式 计算公式 Wi-Fi理论带宽 (符号位长码率子载波数量空间流) 传输时间 符号位长 一个Symbol能承载的bit数量,这个与调试有关。 11a/g11n11ac11ax最大调制方式64QAM64QAM256QAM1024QAMbit数/Symbol66810 码率 Wi-Fi在…
2025/2/1 10:57:04 人评论 次浏览前天晚上一个同事在百度上抓取数据,导致142主库上的mysql-bin.000940日志暴增,基本上没到半小时就1G,容量暴满,主库mysql停止运行,主站无法连接数据库。后查日志得知容量已满,匆忙间一下子把前几天的mysql-…
2025/2/1 10:56:34 人评论 次浏览