Toggle navigation
Shunyu's Blog
Home
Archive
Archive
路漫漫其修远兮,吾将上下而求索。
Show All
80
强化学习
29
python
28
强化学习论文
17
linux
15
强化学习思考
11
documentation
8
mac
5
pycharm
5
conda
4
docker
3
matplotlib
3
pip
3
环境配置
2
anaconda
2
jupyter
2
latex
2
windows
2
生活
1
随笔
1
Collections
1
cuda
1
cudnn
1
git
1
github
1
jekyll
1
mongodb
1
nohup
1
numpy
1
nvidia
1
pandas
1
pytorch
1
screen
1
supervisor
1
tensorboard
1
ubuntu
1
zsh
1
2188 August
[置顶] Collections
资料收藏
2020 October
python 中 os 与 shutil 的使用
python 中 os 与 shutil 的使用
2020 August
crontab 执行定时任务
crontab 执行定时任务配置
OpenAI Gym 库使用小技巧
OpenAI Gym 库使用小技巧
ssh 密钥登陆服务器
ssh 设置密钥及配置 config
2020 July
强化学习论文(17)MAAC
Actor-Attention-Critic for Multi-Agent Reinforcement Learning
强化学习论文(16)Qatten
Qatten: A General Framework for Cooperative Multiagent Reinforcement Learning
强化学习论文(15)Lenient-DQN
Lenient Multi-Agent Deep Reinforcement Learning
2020 June
强化学习论文(14)Dec-HDRQNs&CERTs
Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability
强化学习论文(13)Fingerprints
Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning
强化学习论文(12)SchedNet
Learning to Schedule Communication in Multi-agent Reinforcement Learning
强化学习论文(11)ATOC
Learning Attentional Communication for Multi-Agent Cooperation
强化学习论文(10)QTRAN
QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement learning
强化学习论文(9)QMIX
QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
强化学习论文(8)VDN
Value-Decomposition Networks For Cooperative Multi-Agent Learning
强化学习论文(7)COMA
Counterfactual Multi-Agent Policy Gradients
强化学习论文(6)DCC-MD&MADDPG-MD
Message-Dropout: An Efficient Training Method for Multi-Agent Deep Reinforcement Learning
强化学习论文(5)MD-MADDPG
Improving coordination in small-scale multi-agent deep reinforcement learning through memory-driven communication
强化学习论文(4)BiCNet
Multiagent Bidirectionally-Coordinated Nets Emergence of Human-level Coordination in Learning to Play StarCraft Combat Games
强化学习论文(3)CommNet
Learning Multiagent Communication with Backpropagation
强化学习论文(2)RIAL&DIAL
Learning to Communicate with Deep Multi-Agent Reinforcement Learning
强化学习论文(1)MADDPG
Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
2020 May
mongodb docker 集群搭建
Replica Set 架构 mongodb docker 集群搭建
2020 April
强化学习思考(11)Advanced Policy Gradient
Advanced Policy Gradient
强化学习思考(10)Deep Q Network
Deep Q Network
强化学习思考(9)值函数方法
值函数方法
强化学习思考(8)Actor-Critic 方法
Actor-Critic 方法
强化学习思考(7)策略梯度
策略梯度
安装配置 supervisor 用于管理守护进程
安装配置 supervisor 用于管理守护进程
ubuntu 安装 nvidia 显卡驱动
ubuntu 安装 nvidia 显卡驱动
强化学习思考(6)蒙特卡罗和时序差分
蒙特卡罗和时序差分
强化学习思考(5)动态规划
动态规划
强化学习思考(4)模仿学习和监督学习
模仿学习和监督学习
python setup.py 和 pip install . 区别
本地包安装中 python setup.py 和 pip install . 区别
强化学习思考(3)马尔可夫决策过程
马尔可夫决策过程
强化学习思考(2)强化学习简介
强化学习简介
强化学习思考(1)前言
前言及总体框架目录
pytorch 小技巧
pytorch 小技巧
Matplotlib 基础使用
Matplotlib 基础使用
2020 March
python 中配置 linux 环境变量
python 中配置 linux 环境变量
2020 January
服务器配置 jupyter notebook
linux 服务器配置 jupyter notebook 或 jupyter lab
2019 October
pycharm 配色方案
pycharm 配色方案
linux 服务器用户群组操作
linux 服务器用户群组操作
cuda + cudnn 用户配置
为用户配置单独的 cuda 和 cudnn
linux 小技巧
查看重要信息以及一些命令使用
2019 August
python 小技巧
python 小技巧
Pandas 基础使用
Pandas 基础使用
git 基础使用
git 使用基础命令
Windows 下搭建 FTP 服务器
win 10 下搭建 FTP 服务器
python 文件开头两行注释解释
python 文件开头两行 #!/usr/bin/python 和 # -*- coding:utf-8 -*- 解释
PyCharm 新建文件时自动添加基础信息
PyCharm 新建文件时自动添加基础信息
python 字符串模式区别
python 字符串模式 u, r, b 的区别
python 文件读写模式区别
python 文件读写模式 r, r+, w, w+, a, a+ 的区别
python 拷贝的区别
python 中的视图(浅拷贝)和副本(深拷贝)的区别
本地连接远程服务器 GUI 图形界面
在本地显示远程服务器上运行得到的图形界面
pycharm 自动排版 python 代码
使用自带功能或者 autopep8 自动排版 python 代码
NumPy 基础使用
NumPy 基础使用
matplotlib 中文字体支持
linux 下 matplotlib 中文字体支持
python 虚拟环境配置
python 虚拟环境配置
pip 和 conda 包的转移复制
pip 和 conda 包的转移复制
pip 和 conda 包的管理使用
pip 和 conda 包的管理使用
conda 环境的转移复制
conda 环境的转移复制
2019 July
Dockerfile 基础格式
Dockerfile 基础格式
Docker 基础使用
Docker 使用基础命令
2019 June
OMP: Error #15
OMP: Error #15: Initializing libiomp5.dylib, but found libiomp5.dylib already initialized.
ImportError: Python is not installed as a framework.
运行 matplotlib 时出现 ImportError: Python is not installed as a framework.
2019 May
iterm2 + zsh + vim 配置
macOS/Linux 下进行 iterm2 + zsh + vim 配置
2019 March
python 中利用 pickle 保存变量
利用 pickle 将变量结构及值,以便下次读取使用
使用 screen 后台运行命令避免 SSH 断连
Linux 服务器使用 screen 让进程在后台可靠运行,防止客户端 SSH 连接关闭导致进程挂断
使用 nohup 后台运行命令避免 SSH 断连
Linux 服务器使用 nohup 让进程在后台可靠运行,防止客户端 SSH 连接关闭导致进程挂断
pycharm 连接远程服务器
在本地编辑代码同步到远程服务器上运行
python 顺序执行多个 py 文件
通过写 python 代码来顺序执行多个 py 文件
python 相对路径
相对路径:‘’、‘/’、'./'、'../'
2019 January
LaTeX 手动安装宏包
LaTeX 手动安装宏包(package)的整套流程
在 matplotlib 中使用 LaTeX 渲染文本
Windows 中配置适用于 matplotlib 的 CTeX 套装
python 中 import 用法
python 中 import 同级目录、子目录、上级目录的方法及 sys.path.append() 说明
anaconda 下安装 jupyter notebook
jupyter notebook 报错找不到 kernel 的解决及其他理解
2019-01-10 随笔
乱写的东西
Github Pages 搭建博客
Github Pages + Jekyll 搭建博客
Hello, World
Hello, World