通过与 Jira 对比,让您更全面了解 PingCode

  • 首页
  • 需求与产品管理
  • 项目管理
  • 测试与缺陷管理
  • 知识管理
  • 效能度量
        • 更多产品

          客户为中心的产品管理工具

          专业的软件研发项目管理工具

          简单易用的团队知识库管理

          可量化的研发效能度量工具

          测试用例维护与计划执行

          以团队为中心的协作沟通

          研发工作流自动化工具

          账号认证与安全管理工具

          Why PingCode
          为什么选择 PingCode ?

          6000+企业信赖之选,为研发团队降本增效

        • 行业解决方案
          先进制造(即将上线)
        • 解决方案1
        • 解决方案2
  • Jira替代方案

25人以下免费

目录

为什么要用Java开发高频交易系统

因为Java 不在启动时编译代码的原因与后续的性能优化有关。通过观察应用程序运行并分析实时方法调用和类初始化情况,Java 对经常被调用的代码部分进行编译。

一、为什么要用Java开发高频交易系统

Java 不在启动时编译代码的原因与后续的性能优化有关。通过观察应用程序运行并分析实时方法调用和类初始化情况,Java 对经常被调用的代码部分进行编译。它甚至可能会根据经验做出一些假设 (某些代码永远不会被调用,或者某个对象始终是一个字符串)。

编译过的代码执行速度非常快,但有三个缺点:

  • 一个方法需要被调用一定次数才能达到编译阈值,然后才能被编译和优化 (这个阈值是可配置的,通常在 10000 次左右)。在此之前,未优化的代码不会“全速”运行。在更快的编译和高质量的编译之间存在折衷 (如果假设是错误的,就会发生编译成本)。
  • 当 Java 应用程序重新启动时,我们又回到了起点,必须等待再次达到阈值。
  • 有些应用程序有一些不常被调用但很关键的方法,这些方法只会被调用几次,但在被调用时需要非常快。

Zing 通过让它的 JVM“保存”已编译的方法和类的状态(也就是所谓的 profile)来解决这些问题。这个独特的功能叫做 ReadyNow,也就是说 Java 应用程序可以始终以优异速度运行,即使是在重启之后。

当你使用已有的 profile 重新启动应用程序,Azul JVM 会立即收回以前的决策并直接编译重要的方法,以解决 Java 的预热问题。

此外,你也可以在开发环境中构建一个 profile 来模拟生产行为。优化后的 profile 能部署到生产环境中,并知道所有关键路径都已经过编译和优化。

第二个问题是在垃圾回收期间,整个应用程序可能会停顿几毫秒到几秒钟 (延迟会随着代码复杂性和堆大小的增加而增加),更糟糕的是,你无法控制这种情况何时发生。

虽然对很多 Java 应用程序来说,暂停应用程序几毫秒甚至几秒是可以接受的,但对于低延迟应用程序来说,这是一场灾难,无论是在汽车、航空航天、医疗还是金融领域。

GC 影响对于 Java 开发人员来说是一个很大话题,Full GC 通常也叫作“停止世界的停顿(s较好-the-world)”,因为它会冻结整个应用程序。

多年来,有很多 GC 算法都试图降低吞吐量 (有多少 CPU 时间用于应用程序逻辑执行而不是垃圾回收) 和 GC 停顿 (我可以暂停应用程序多长时间)。

从 Java 9 发布以来,G1 一直是默认的垃圾回收器,其主要思想是根据用户提供的时间目标对 GC 停顿进行划分。它通常提供较短的停顿时间,但以降低吞吐量为代价。此外,停顿时间随着堆的大小而增加。

Java 提供了大量的设置参数,从堆大小到回收算法以及分配给 GC 的线程数。因此,Java 应用程序通常会配置大量的参数:

很多开发人员通过各种技术来避免 GC。最主要的是,如果我们少创建一些对象,那么后续要清除的对象就越少。

一种古老的 (仍然在使用) 技术是使用对象池。例如,数据库连接池可以保存 10 个已经打开的数据库连接,以便在需要时使用。

一些专家甚至处于无奈而选择完全覆盖 Java 的内存管理机制,由自己来管理内存分配,这虽然解决了问题,但也带来了更多的复杂性和风险。

因此,我们需要考虑使用其他 JVM,于是我们决定尝试 Azul Zing JVM。

很快,我们就能够在几乎无停顿的情况下实现很高的吞吐量。

这是因为 Zing 使用了一个叫作 C4(Continuously Concurrent Compacting Collector,连续并发压缩回收器) 的垃圾回收器,它可以进行无停顿的垃圾回收,而不管 Java 堆有多大 (可以达到 8TB)。

这是通过在应用程序运行时并发映射和压缩内存来实现的。

此外,它不需要修改代码,而且延迟和速度方面的改进都是开箱即用的,不需要进行繁杂的配置。

Java 程序员可以享受到两方面的好处:Java 的简单性 (不需要担心创建太多的新对象) 和 Zing 的底层性能,允许系统中出现高度可预测的延迟。

GCeasy 提供了通用 GC 日志分析器,我们可以在真实的自动交易应用程序 (在模拟环境中) 中快速地对 JVM 进行比较。

在我们的应用程序中,使用 Zing 的 GC 大约比使用标准 Oracle Hotspot JVM 的 GC 快 180 倍。

更令人印象深刻的是,GC 停顿通常对应于实际的应用程序停顿时间,而 Zing 的 GC 通常是并行发生的,实际的停顿很少,甚至没有停顿。

总之,在享受 Java 的简单和特性的同时,仍然有可能实现高性能和低延迟。C++ 一般用于开发特定的底层组件,如驱动程序、数据库、编译器和操作系统,但大多数现实生活中的应用程序可以使用 Java 开发,甚至是要求很高的应用程序。

这就是为什么 Java 是排名名列前茅的编程语言(根据 Oracle 的说法),并拥有数百万开发者,在全世界有超过 510 亿个 Java 虚拟机。

延伸阅读:

二、高频交易机会挖掘模型的数据预处理

交易所行情数据中包括十档行情、委托队列、逐笔委托和逐笔成交四类数据,在连续撮合时间内,十档行情和委托队列是间隔3s的时间序列数据,体现了市场当前状态下的买卖委托情况,逐笔委托和逐笔成交两种逐笔数据的时间间隔不固定,是市场真实委托和成交情况的反应。在使用逐笔数据之前,将其进行重采样使得将样本对齐到固定间隔数据中。以十档行情数据的时间为节点,对逐笔委托和逐笔成交的数据进行重采样处理,将获得的在3s内逐笔数据各项特征的各项统计值用作样本特征。其中统计值包括最值、平均值、中位数、标准差、方差等。
此外,使用z-score标准化对特征进行处理,消除不同指标具有不同的量级和量纲的影响,保证结果的准确性,缩放之后的所有特征是均值为0,方差为1的无量纲序列。

相关文章