Chenlong's blog

US旅行游记第一次-2025年

TL;DR时间真是过的太快了，在学术生涯末期有幸参与TRB学术会议，同时也是一次学术旅游的机会！第一次去美国真的非常痛苦一、行程安排1 月 3 日晚：从浦东出发（白天）1 月 3 日晚：威尔逊机场 1 月 4 日白天【纽约】：纽约🥯，时代广场，灰狗🚌，到达 Airbnb 🏠 1 月 5 日白天【华盛顿】：早中饭 🥚，华盛顿🪦，国家历史博物馆，TRB 会场，Trade Joey 杂货铺

2025-07-19

生活杂谈

#旅行

如何理解广告系统

在广告系统中，主要存在三个核心角色：广告主、媒体平台和消费者。这三者之间形成了一个相互依存的生态系统。广告主：投入广告预算（quota），期望获得最大的营销效果（conversion）和投资回报（ROI）媒体平台：提供广告展示空间（VV），需要平衡用户体验（多维）和广告收入消费者：获取免费或低价内容服务，同时被动接受广告信息一、如何售卖广告？1. 直接投放通过自有广告平台或代理公司直

2025-03-09

生活杂谈

#计算广告

2025 年度后数据工程需要了解的基本概念

该系列文章主要介绍下列基本概念：数据仓库、数据湖、数据湖仓云存储平台 AWS、Azure、Google cloud 优化数据存储大数据手段 Apache Spark、Kafka 实时数据处理 ETL 事件驱动架构 EDA 其他 topic：数据关联、xAI、推理计算、无限存储、人类在环集成帮助更好的理解数据的方式一、数据仓库、数据湖、数据湖仓1.1 历史数据仓库（data ware

2025-01-23

计算机科学

#数据工程

生存分析基本概念、常见方法、评价指标

本文主要介绍生存分析所需要解决的问题，常见的基本概念、解决方法，帮助快速理解一、问题背景生存分析（Survival analysis）是一种统计方法，专门用于研究「事件的一系列发生节点」的时间，常见的事件列表如下：（疾病治疗）研究某种病被治疗之后的复发情况，如果复发则被认为“死亡”，如果未复发则被认为是“生存”，在这种情况下关注“复发”的医学规律（职业升迁）在职业升迁的研究中，升迁可以看作

2025-01-16

算法基础

#因果推断

ROI_监督学习_一次性学习, LTV_强化学习_持续学习

这篇文章算是从第一份实习开始之后就一直想写，但是又不知道怎么表述，直到最近看到《Rich Sutton，toward a better deep learning》关于深度学习中短期学习与持续学习的讨论，才发现这是我一直想表达的：不断的训练单个模型最优并不意味着全局最优，但可悲的是团体无法跨越时间长度来追求长期价值，除非具有强有力的集权注意，希望这篇文章能带给你启发！ 0x01 互联网公司与 M

2024-12-08

算法基础

#机器学习 #强化学习

小白的在线支付方式折腾

因为希望开通 OPENAI-API，需要有美区发行的信用卡，由此折腾了虚拟信用卡 wildcard、国内 MasterCard、美区 PayPal 来完成 OPENAI、App Store、Amazon 海淘等过程，以下为小白经验贴，如有不对的地方欢迎指正一、支付方式简介支付方式通常可以分为：银行卡支付、移动支付、数字钱包、银行转账、加密货币、预付卡、电子支票等方式，这里注重解释前三者：银行

2024-11-17

生活杂谈

#数字移民

大数据与分布式系统概述

这里系统自顶向下的对于大数据系统下的分布式平台做一次综述，包括一些简单的实际操作。一、背景：什么是分布式系统A brief introduction to distributed systems 分布式系统是以单一完整系统（Single coherent system）为表现的自助计算单元的集合（Collections of autonomous computing elements），实现的技

2024-10-21

计算机科学

#外部阅读

如何建立自己的代码心智模型

以 LLM 为底层的自动代码补全工具帮助我们从代码敲击的背景下剥离出来，一定程度上减轻了劳动量。但是其能力的限制使得通常无法在高度定制化的场景下给出最优方案，此时对于熟悉 Copilot 的我们会发现生疏到无法解决。因此如何权衡自动补全工具带来的便利性和自身能力成长是必要的，合理的解决方法是建立心智模型来得其意，再指挥工具免其劳帮助工作效率的提升。本文从自身的角度建立自己的心智模型，一、从 Ch

2024-10-08

计算机科学

#代码基础 #生产效率

阅读 Casual inference_总结中

上一篇文章从概念的角度解释了因果推断中常见的问题，同时介绍因果图的分析方法来得到相关性信息和因果性信息流之间的方法。在这篇将更加深入的理解干预（Invention）、后门路径（Backdoor path）和后门调整（Backdoor adjustment）来准确的计算因果效应。以及假设较为困难的前门准则和 do 算子的方式来估计因果效应。这些方法的核心目的是：将因果估计转换成为统计估计，进而估计结

2024-09-18

算法基础

#因果推断

阅读 Casual inference 总结上

这篇文章主要针对 casual inference 的前置概念进行介绍，核心希望回答的问题是为什么需要因果性，如何得到因果估计。介绍到常见的因果发现的方法。之后会在因果路径的基础上介绍更多的因果方法。一、为什么需要因果性而不是相关性1.1 从辛普森悖论说起辛普森悖论的现象目的希望查看药物T（A，B）在患者 X（轻、重、总体）下的效果悖论：从分层人群来看，药物 A 均优于药物 B 从总体

2024-09-13

算法基础

#因果推断