大数据与分布式系统概述 这里系统自顶向下的对于大数据系统下的分布式平台做一次综述,包括一些简单的实际操作。 一、背景:什么是分布式系统A brief introduction to distributed systems 分布式系统是以单一完整系统(Single coherent system)为表现的自助计算单元的集合(Collections of autonomous computing elements),实现的技 2024-10-21 计算机科学 #外部阅读
如何建立自己的代码心智模型 以 LLM 为底层的自动代码补全工具帮助我们从代码敲击的背景下剥离出来,一定程度上减轻了劳动量。但是其能力的限制使得通常无法在高度定制化的场景下给出最优方案,此时对于熟悉 Copilot 的我们会发现生疏到无法解决。因此如何权衡自动补全工具带来的便利性和自身能力成长是必要的,合理的解决方法是建立心智模型来得其意,再指挥工具免其劳帮助工作效率的提升。本文从自身的角度建立自己的心智模型, 一、从 Ch 2024-10-08 计算机科学 #代码基础 #生产效率
阅读 Casual inference_总结中 上一篇文章从概念的角度解释了因果推断中常见的问题,同时介绍因果图的分析方法来得到相关性信息和因果性信息流之间的方法。在这篇将更加深入的理解干预(Invention)、后门路径(Backdoor path)和后门调整(Backdoor adjustment)来准确的计算因果效应。以及假设较为困难的前门准则和 do 算子的方式来估计因果效应。这些方法的核心目的是:将因果估计转换成为统计估计,进而估计结 2024-09-18 算法基础 #因果推断
阅读 Casual inference 总结上 这篇文章主要针对 casual inference 的前置概念进行介绍,核心希望回答的问题是为什么需要因果性,如何得到因果估计。介绍到常见的因果发现的方法。之后会在因果路径的基础上介绍更多的因果方法。 一、为什么需要因果性而不是相关性1.1 从辛普森悖论说起 辛普森悖论的现象 目的希望查看药物T(A,B) 在患者 X(轻、重、总体)下的效果 悖论: 从分层人群来看,药物 A 均优于药物 B 从总体 2024-09-13 算法基础 #因果推断
盛夏之后,苦秋之前 | 致求职 从未想象过南方的夏天会如此的丰富多彩,阳光和暴雨的展开姿势是内陆从未见过的大开大合。当天气明媚的时候,仿佛广州塔都在微笑,而当暴雨倾城,突然分不清天地之间的边界。很幸运可以在六月底背负着被航班取消,踏着十个小时的高铁来到羊城,开始了自己的“无问西东“的暑期实习,也希望自己的秋招可以顺利。 “无问西东” 是这个暑假的旋律 朴实竟然是我对腾讯的第一眼,T.I.T 创意园中穿插着矮楼和高树,这些树儿 2024-09-03 生活杂谈 #生活杂谈
电脑键盘背后的故事 feat. 宁芝 Plum 最近购买了一款静电容键盘 Niz68 有线双模,首先面临的最大的问题是这款键盘没有功能键,在对功能键的摸索中发现了自定义键盘的海洋,有一种第一次看到 vim的使用方式的敬畏感油然而生。更重要的激发对于键盘,这个在电脑诞生就陪伴人们的工具,产生了好奇:它是如何一步一步发展成为现在这个样子?它之后是否还会改变?从实体键盘到无线键盘,从电脑键盘到手机虚拟键盘,本文搜集材料来介绍键盘的发展史。 电报 打字 2024-04-30 生活杂谈 #Apple #macOS #静电容键盘
面试经验 vol3 | 从 AB 实验到因果推断 这里参考很多前人的经验: 因果推断笔记——入门学习因果推断在智能营销、补贴的通用框架(十一)-腾讯云开发者社区-腾讯云 基础理论0. 相关性和因果性在日常的生活和数据分析中,我们可以得到大量和相关性的杰伦,通常这些相关性和因果性存在对称性,“小偷多的地方,警察多” or “警察多的地方,小偷也会多”,那么是否需要对这个城市增加警力? 因果性往往是存在单箭头的,比如辛普森悖论 吃药的意愿收到 X 2024-04-29 数据科学 #机器学习 #因果推断 #AB 实验 #观察数据建模 #选择偏差
面试经验 Vol2 | 损失函数和评价指标总结 Mitchell 在《机器学习》中对其的定义是: 一个计算机程序被认为能够从经验 E 中学习,去完成任务 T,达到性能度量 P,当且仅当,通过经验 E 的学习,其在任务 T 上的性能度量 P 得到了提升。 假设我们有一个模型 $f(x;θ)$,其中 x 是输入,θ 是模型的参数。给定一组训练数据 $D={(x_i,y_i)}_{i=1}^N$,其中 $x_i$是输入,$y 2024-04-29 数据科学 #机器学习 #深度学习 #损失函数 #评价指标 #模型评估
面试经验 vol1 | 计算机基础知识 总结常见的诞生于 计算机组成原理,操作系统、 计算机网络、算法设计基础中的常见的知识,在这个过程中回顾快速入门计算机知识中,从纸条到硬盘、从继电器到二极管;这门学科的目的是实现自动化的操作,帮助我们高效的完成既定任务。在这个过程要克服死记硬背的指令,来解决盲目寻找答案的过程。 操作系统相关1.1 Shell和脚本使用字符串和计算机内核进行交互。其核心功能是允许执行程序,输入并获取某种结构化的输出。 2024-04-29 计算机科学 #计算机网络 #计算机组成原理 #面试经验 #程序设计基础
北京西二旗租房攻略 0x01 租房目标的确定租房是希望在一定的成本范围内找到满足自己最大效用的方式。可以从货币成本、个人喜好、社会经济因素来观察。每个人的效用具有不同个人差异性,但是租房经验往往是可以互相参考的,这也是互联网平台传播的意义所在。分享你所看到的,来铸造集体的记忆。 0x02 租房平台NOTE:租房平台越规范,信息获取越容易,但是价格也会更高 租房平台按照熵增的顺序可以分为: 基于互联网和算法:自如、安 2024-04-29 生活杂谈 #租房 #西二旗 #实习生 #短租