Archive

路漫漫其修远兮,吾将上下而求索。
2188 August

[置顶] Collections

资料收藏


2020 October

python 中 os 与 shutil 的使用

python 中 os 与 shutil 的使用


2020 August

crontab 执行定时任务

crontab 执行定时任务配置


OpenAI Gym 库使用小技巧

OpenAI Gym 库使用小技巧


ssh 密钥登陆服务器

ssh 设置密钥及配置 config


2020 July

强化学习论文(17)MAAC

Actor-Attention-Critic for Multi-Agent Reinforcement Learning


强化学习论文(16)Qatten

Qatten: A General Framework for Cooperative Multiagent Reinforcement Learning


强化学习论文(15)Lenient-DQN

Lenient Multi-Agent Deep Reinforcement Learning


2020 June

强化学习论文(14)Dec-HDRQNs&CERTs

Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability


强化学习论文(13)Fingerprints

Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning


强化学习论文(12)SchedNet

Learning to Schedule Communication in Multi-agent Reinforcement Learning


强化学习论文(11)ATOC

Learning Attentional Communication for Multi-Agent Cooperation


强化学习论文(10)QTRAN

QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement learning


强化学习论文(9)QMIX

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning


强化学习论文(8)VDN

Value-Decomposition Networks For Cooperative Multi-Agent Learning


强化学习论文(7)COMA

Counterfactual Multi-Agent Policy Gradients


强化学习论文(6)DCC-MD&MADDPG-MD

Message-Dropout: An Efficient Training Method for Multi-Agent Deep Reinforcement Learning


强化学习论文(5)MD-MADDPG

Improving coordination in small-scale multi-agent deep reinforcement learning through memory-driven communication


强化学习论文(4)BiCNet

Multiagent Bidirectionally-Coordinated Nets Emergence of Human-level Coordination in Learning to Play StarCraft Combat Games


强化学习论文(3)CommNet

Learning Multiagent Communication with Backpropagation


强化学习论文(2)RIAL&DIAL

Learning to Communicate with Deep Multi-Agent Reinforcement Learning


强化学习论文(1)MADDPG

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments


2020 May

mongodb docker 集群搭建

Replica Set 架构 mongodb docker 集群搭建


2020 April

强化学习思考(11)Advanced Policy Gradient

Advanced Policy Gradient


强化学习思考(10)Deep Q Network

Deep Q Network


强化学习思考(9)值函数方法

值函数方法


强化学习思考(8)Actor-Critic 方法

Actor-Critic 方法


强化学习思考(7)策略梯度

策略梯度


安装配置 supervisor 用于管理守护进程

安装配置 supervisor 用于管理守护进程


ubuntu 安装 nvidia 显卡驱动

ubuntu 安装 nvidia 显卡驱动


强化学习思考(6)蒙特卡罗和时序差分

蒙特卡罗和时序差分


强化学习思考(5)动态规划

动态规划


强化学习思考(4)模仿学习和监督学习

模仿学习和监督学习


python setup.py 和 pip install . 区别

本地包安装中 python setup.py 和 pip install . 区别


强化学习思考(3)马尔可夫决策过程

马尔可夫决策过程


强化学习思考(2)强化学习简介

强化学习简介


强化学习思考(1)前言

前言及总体框架目录


pytorch 小技巧

pytorch 小技巧


Matplotlib 基础使用

Matplotlib 基础使用


2020 March

python 中配置 linux 环境变量

python 中配置 linux 环境变量


2020 January

服务器配置 jupyter notebook

linux 服务器配置 jupyter notebook 或 jupyter lab


2019 October

pycharm 配色方案

pycharm 配色方案


linux 服务器用户群组操作

linux 服务器用户群组操作


cuda + cudnn 用户配置

为用户配置单独的 cuda 和 cudnn


linux 小技巧

查看重要信息以及一些命令使用


2019 August

python 小技巧

python 小技巧


Pandas 基础使用

Pandas 基础使用


git 基础使用

git 使用基础命令


Windows 下搭建 FTP 服务器

win 10 下搭建 FTP 服务器


python 文件开头两行注释解释

python 文件开头两行 #!/usr/bin/python 和 # -*- coding:utf-8 -*- 解释


PyCharm 新建文件时自动添加基础信息

PyCharm 新建文件时自动添加基础信息


python 字符串模式区别

python 字符串模式 u, r, b 的区别


python 文件读写模式区别

python 文件读写模式 r, r+, w, w+, a, a+ 的区别


python 拷贝的区别

python 中的视图(浅拷贝)和副本(深拷贝)的区别


本地连接远程服务器 GUI 图形界面

在本地显示远程服务器上运行得到的图形界面


pycharm 自动排版 python 代码

使用自带功能或者 autopep8 自动排版 python 代码


NumPy 基础使用

NumPy 基础使用


matplotlib 中文字体支持

linux 下 matplotlib 中文字体支持


python 虚拟环境配置

python 虚拟环境配置


pip 和 conda 包的转移复制

pip 和 conda 包的转移复制


pip 和 conda 包的管理使用

pip 和 conda 包的管理使用


conda 环境的转移复制

conda 环境的转移复制


2019 July

Dockerfile 基础格式

Dockerfile 基础格式


Docker 基础使用

Docker 使用基础命令


2019 June

OMP: Error #15

OMP: Error #15: Initializing libiomp5.dylib, but found libiomp5.dylib already initialized.


ImportError: Python is not installed as a framework.

运行 matplotlib 时出现 ImportError: Python is not installed as a framework.


2019 May

iterm2 + zsh + vim 配置

macOS/Linux 下进行 iterm2 + zsh + vim 配置


2019 March

python 中利用 pickle 保存变量

利用 pickle 将变量结构及值,以便下次读取使用


使用 screen 后台运行命令避免 SSH 断连

Linux 服务器使用 screen 让进程在后台可靠运行,防止客户端 SSH 连接关闭导致进程挂断


使用 nohup 后台运行命令避免 SSH 断连

Linux 服务器使用 nohup 让进程在后台可靠运行,防止客户端 SSH 连接关闭导致进程挂断


pycharm 连接远程服务器

在本地编辑代码同步到远程服务器上运行


python 顺序执行多个 py 文件

通过写 python 代码来顺序执行多个 py 文件


python 相对路径

相对路径:‘’、‘/’、'./'、'../'


2019 January

LaTeX 手动安装宏包

LaTeX 手动安装宏包(package)的整套流程


在 matplotlib 中使用 LaTeX 渲染文本

Windows 中配置适用于 matplotlib 的 CTeX 套装


python 中 import 用法

python 中 import 同级目录、子目录、上级目录的方法及 sys.path.append() 说明


anaconda 下安装 jupyter notebook

jupyter notebook 报错找不到 kernel 的解决及其他理解


2019-01-10 随笔

乱写的东西


Github Pages 搭建博客

Github Pages + Jekyll 搭建博客


Hello, World

Hello, World