面试经验 vol3 | 从 AB 实验到因果推断 这里参考很多前人的经验: 因果推断笔记——入门学习因果推断在智能营销、补贴的通用框架(十一)-腾讯云开发者社区-腾讯云 基础理论0. 相关性和因果性在日常的生活和数据分析中,我们可以得到大量和相关性的杰伦,通常这些相关性和因果性存在对称性,“小偷多的地方,警察多” or “警察多的地方,小偷也会多”,那么是否需要对这个城市增加警力? 因果性往往是存在单箭头的,比如辛普森悖论 吃药的意愿收到 X 2024-04-29 数据科学 #机器学习 #因果推断 #AB 实验 #观察数据建模 #选择偏差
面试经验 Vol2 | 损失函数和评价指标总结 Mitchell 在《机器学习》中对其的定义是: 一个计算机程序被认为能够从经验 E 中学习,去完成任务 T,达到性能度量 P,当且仅当,通过经验 E 的学习,其在任务 T 上的性能度量 P 得到了提升。 假设我们有一个模型 $f(x;θ)$,其中 x 是输入,θ 是模型的参数。给定一组训练数据 $D={(x_i,y_i)}_{i=1}^N$,其中 $x_i$是输入,$y 2024-04-29 数据科学 #机器学习 #深度学习 #损失函数 #评价指标 #模型评估
面试经验 vol1 | 计算机基础知识 总结常见的诞生于 计算机组成原理,操作系统、 计算机网络、算法设计基础中的常见的知识,在这个过程中回顾快速入门计算机知识中,从纸条到硬盘、从继电器到二极管;这门学科的目的是实现自动化的操作,帮助我们高效的完成既定任务。在这个过程要克服死记硬背的指令,来解决盲目寻找答案的过程。 操作系统相关1.1 Shell和脚本使用字符串和计算机内核进行交互。其核心功能是允许执行程序,输入并获取某种结构化的输出。 2024-04-29 计算机科学 #计算机网络 #计算机组成原理 #面试经验 #程序设计基础
北京西二旗租房攻略 0x01 租房目标的确定租房是希望在一定的成本范围内找到满足自己最大效用的方式。可以从货币成本、个人喜好、社会经济因素来观察。每个人的效用具有不同个人差异性,但是租房经验往往是可以互相参考的,这也是互联网平台传播的意义所在。分享你所看到的,来铸造集体的记忆。 0x02 租房平台NOTE:租房平台越规范,信息获取越容易,但是价格也会更高 租房平台按照熵增的顺序可以分为: 基于互联网和算法:自如、安 2024-04-29 生活杂谈 #租房 #西二旗 #实习生 #短租
Meta quest3 使用折腾指南 Quest3作为一台头戴眼镜内设备,针对现在依赖手机、电脑的工作方式,天然具有“反链接“的特点,同时在国内难以魔法上网和校园网奇葩的路由器的情况,如何顺利的享受虚拟世界的乐趣是一件非常困难的工作。因此在本文总结自己踩过的坑作为记录。 引言对于一些教程用一些未见过的语言来描述 Quest3 的使用过程,实际上是对小白自信心的一次打击,此时针对拿到手,需要了解的事情做一个总结,也就是“拿到 Quest 2024-04-29 生活杂谈 #quest3 #AR 眼镜 #科学上网 #新奇硬件
Python 绘图完整教程 0x00 Basic setting What is matplotlib? Matplotlib is a comprehensive library for creating static, animated, interactive visualization in Python. We can as follows: 创建高质量的图片 创建可以交互的、放大、拖动、更新的图片 定制化风格 2024-04-29 程序设计 #文档阅读 #Python 可视化 #绘图教程
GEATPY 文档阅读 | 面向过程解决 TSP 问题 各种启发式方法很复杂,当时一般不需要自己手动实现,python中找到GeatPy是个还不错的包,geatpy 是 Python 中的一个进化算法库,专门用于解决复杂的优化问题。它基于遗传算法和进化策略,提供了一个高效、灵活的工具集,用于处理各种优化问题。本文以TSP问题为基础,介绍面向过程,这种最基本也是最直观的想法来介绍库中的基本API。 一、问题描述TSP问题需要从起始点出发,经过每个点一次, 2024-04-29 交通工程 #运筹优化 #启发式算法 #TSP 问题
数据结构和算法基础 Vol9 对于图的基础认识和问题描述,进而给出基本的图遍历求解问题的思路 0x01 对于图的基本认识对于数据结构的存储无非就是“增删改查”,所以对于图(Graph)的认识也可以从这个角度出发。 不过与基本的数组和链表不同的是,数组作为顺序存储、链表作为链接存储更多的是代表计算机存储的一种方式,是更为适合计算理解而对人类不友好的;图作为一个存在日常生活中的数据结构,可以很容易的被人理解,但是往往在计算机存储中 2024-04-29 程序设计 #数据结构 #图 #遍历
数据分析和算法基础 Vol9 堆栈 Stack是一种线性表数据,只允许在表的一端进行插入(push)和删除(pop)操作。堆栈的好处在于操作时间为线性的。因此可以极大的提供效率。最基本的题目是《T20 有效的大括号》,而在其中更加复杂的是单调栈: 单调栈(Monotone stack):一种特殊的栈,在先进先出的基础上,要求从top到bottom的元素是单调的(单调递增 or 单调递减) 0x01 理解单调栈维护一个单调 2024-04-29 程序设计 #单调栈 #复习 #力扣刷题
CS229 机器学习 Vol14| GBDT 与 Kaggle 回顾说明是基于树的集成学习,同时给出基本的随机森林和Adaboost解释,以及GBDT的两种工程实现XGboost和lightGBM的介绍,并用实际的Kaggle例子解释使用。 0x01 树(Tree)与集成学习(Ensemble learning)1.1 什么是决策树在之前的文章已经提到过 决策树CART与手撕代码,决策树是一类基于分治思想的非参数的机器学习方法。通过自上而下的树形拆分对数据进行 2024-04-29 算法基础 #梯度提升树 #面试技巧 #Kaggle 比赛