量化机器学习里“模型走捷径”的典型现象与应对方法

这个现象在量化里特别典型:模型会优先学“最容易降低 loss 的信号”,而这些信号往往是: 不可交易(跌停 / 停牌 / 流动性太差、成交冲击巨大) 不允许暴露(行业 / 风格 / beta 太强,后面优化器会剪掉) 看起来很准但其实是泄露 / 同步信息(时间戳没对齐、用到了收盘后才能知道的东西) 想让训练“无偏”(更准确说:对齐你最终能落地的 alpha key driver),常用办法可以按“从简单到高级”分四类: 1) 先把“不可实现的部分”从数据层面关掉 这是性价比最高的一步(很多时候比改 loss 更有效): 严格可交易过滤:跌停 / 停牌 / 一字板 / 极端流动性日,直接把这些样本从训练或 label 里 mask 掉(不参与 loss)。 时间戳对齐:特征只用你下单前能拿到的版本;label 也按你真实成交价/成交时点定义。 训练集的股票池 = 实盘股票池:别让模型在训练时学到“小票、低流动性”带来的虚假 alpha。 这一步的目的:别让模型把“你根本做不到的收益”当成最省力的捷径。 2) 让 label 变成“你真正想赚的东西” 如果 label 本身就是“毛收益”,模型天然会偏向那些 毛收益很大但成本也很大 / 不可交易 …

Video editing skills

Introduction to the general function of Final Cut Pro https://www.youtube.com/watch?v=Tb0ZMMgJsRw&t=30s&ab_channel=Whale_xuxu Control the size of a library in Final Cut Pro https://www.youtube.com/watch?v=H9NBocuX2Ts Add caption automatically https://www.jdmm.cc/file/2532754/

Dual Boot Ubuntu 22.04 and Windows 11 on a windows computer (dual systems)

This tutorial is about installing a Ubuntu 22.04 desktop OS on a windows computer and booting them freely. 1. Prerequisite A computer running Windows 11 OS. An empty USB stick 2. My Environment My computer: MSI GE76 12UHS (12 gen intel cpu, Nvidia 3080Ti) USB: Kingston 128gb 3. Download Ubuntu 22.04 ios file online. From …

Overlay pictures anywhere in Latex

Reproduced from https://tex.stackexchange.com/a/408447 Overlay a picture anywhere on a page (doesn’t influence the original format) : \documentclass{article} \usepackage{graphicx,tikz} \pagestyle{empty} \begin{document} \mbox{} \begin{tikzpicture}[overlay,remember picture] \node[anchor=north west,inner sep=0pt]at ([xshift=1cm,yshift=-1cm]current page.north west) {\includegraphics[width=5cm]{example-image-a}}; %only to show the values: \draw[red,<->] ([yshift=-1cm]current page.north west) –++ (1,0) node[midway,above]{1cm}; \draw[red,<->] ([xshift=1cm]current page.north west) –++ (0,-1) node[midway,right]{1cm}; \draw[red,<->] ([xshift=1cm,yshift=-3cm]current page.north west) –++ (5,0) …

在 Oracle Cloud 搭建終身免費 VPN 服務

本文转自 https://www.jkg.tw/p3163/ 最近看到甲骨文又開放永久免費使用的虛擬機,所以一口氣就去申請了四台 兩台在日本東京,兩台在美國西岸鳳凰城。。。🥺 機器的效能大約跟一台樹莓派 3 差不多,而且一個帳號可以開兩台虛擬機 每月還有 10TB 的流量,拿來搭一個 VPN 來用非常讚,如果是給自己使用的話是非常富餘的~ 有需要了解更多甲骨文永久免費服務的話,可以去官網參考常見問題 日本東京跟韓國首爾的伺服器比較難搶,因為是亞洲線路,延遲比較低,所以非常搶手 我大約花了兩個多小時才搶到兩台東京,台灣中華電信晚上高峰 ping 過去大約 35ms 左右,還算蠻穩定的 甲骨文的韓國首爾伺服器大約在 75ms 左右,所以除非有特殊用途,不然亞洲開一個東京即可 美西鳳凰城則相對簡單,我美西兩台直接按下去就秒開了,運氣很好~ 美西的 ping 則是大約在 170ms 左右,表現中規中矩 Google Outline Outline 是一個開放原始碼的 VPN 工具,基於 ShadowSocks 基礎上開發的,有良好加密跟隱蔽性 官網上有一系列 GUI 軟體可以提供快速部屬伺服器跟全平台客戶端 App 可以安裝,而且是全免費的 廢話不多說,要部屬伺服器就先下載 Outline Manager App Outline Manager 支援三種平台的自動快速部屬,其中 DigitalOcean 是需要另外購買的 Google Cloud Platform 跟 Amazon …

Squeezing space in LaTeX

This article is reproduced from https://robjhyndman.com/hyndsight/squeezing-space-with-latex/, and can be deleted if requested. I’ve been writing a grant application with a 10-page limit, and as usual it is difficult to squeeze everything in. No, I can’t just change the font as it has to be 12 point with at least 2 cm margins on an A4 …

Bitrix 24 – A suitable free project management webapp for student groups

Recently, I want to find a suitable project management webapp for my students. After testing Monday.com, Clickup, Trello, TAIGA, etc. , I found that the free plan of Bitrix 24 is currently a better choice for small student groups that have less than 10 members. The reasons are as follows: You can have 10 members …