一边玩情趣玩具一边倍速刷完了 4th bpf 中国开发者大会视频 (https://space.bilibili.com/518970180/lists/7986231) ,质量还挺高的,比某些广告con好多了,随机发表感想:

陈鹏飞-基于eBPF的端到端请求追踪
对 HTTP1.1 注入 OTel headers,用 sockmap + sk_msg + bpf_msg_push_data 的做法,我的评价是没有吃过 sockmap 的巨型虫子不知这水有多深😀你在生产环境跑一个试试,go 程序默认开启的 mptcp 一秒就把 sockmap 崩了。
https://github.com/IntelligentDDS/zerotracer/blob/b9e2f2170e4508a251b5a30fd1199dca142ebb5d/src/bpf/tracing.bpf.c#L435

陈涛-eBPF内核栈解析特性现状及发展
最有含精量的是指出 bpf_get_stack 甚至 perf record 可能采集到其他进程的的栈,这是由于内核函数 get_perf_callchain 对同一个 cpu 会复用 callchain_entry,如果 process A 已经采集了栈还未返回,然后被 process B 抢占,而 process B 也执行 get_perf_callchain,那 B 的栈就覆盖了 A 的栈,等 A 调度回来恢复执行的时候返回的就是 B 的栈。实在是深邃的观察!👍
https://lore.kernel.org/all/20260206090653.1336687-1-chen.dylane@linux.dev/

黄富-给上游引入global percpu data特性
请关注 @eBPFTalk001 喵,请关注 @eBPFTalk001 谢谢喵。

黄竹刚-eBPF开发的10个实战陷阱
我参与写作的新书《eBPF 云原生安全:原理与实践》目前正在新鲜发售中

赵翔宇-面向Kubemetes的eBPF 云原生可观测实践
bpf 抓包抓得我眼前一亮,一般抓包就是把 skb header+payload 塞到 ringbuf 让本机用户态读出来,然后爱上报上报;这位同性居然把满足过滤条件的 skb redirect_clone 到 vxlan0 然后封包送到远程的抓包中心化服务器,太聪明了👍

曲盼旺-融合 eBPF 与 AI 技术的微架构能效分析研究
关注的是 CPU 硬件功耗而非软件的性能,通过 bpf 采集八项 per-task 的 PMU 指标(insns, cycles, stall-be, stall-fe, etc.),建立一个硬件能耗和他们的线性回归,这样可以在多重热点事件混杂时做归因。我觉得很有意思。

郑昱笙、于桐、李嘉耀-bpftime for GPU:将eBPF扩展到GPU上
工作量和复杂度都很惊人,我直接照抄一下它 nv_attach_impl:
Frida-gum hook __cudaRegisterFatBinary() 拦截 -> cuobjdump --extract-ptx 提取 PTX -> PTX pass 变换 -> LLVM 编译 bpf 成 PTX -> Register Guard -> nvPTXCompiler 编译 PTX 成 cubin -> 替换 GPU module
(如果 n 厂能官方收录这套方案就好了,球球了)

焦德伟-基于eBPF的带内带外协同能耗管理技术研究与实践面向LLMToken成本最大化
虽然没有听懂,但是和榨干硬件不同,speaker说大模型推理512上下文和4k上下文功耗相同,可以做 gpu 节能,拦截 ioctl(NVML_API_FUNC) syscall 返回,提取 GPU 状态参数,通过 IPMI out-of-band 接受 BMC 的策略,修改 ioctl 响应,降低功耗。

其余还有好几个 storage IO、bpf scheduler、bpf reuseport、bpf RDMA 等震撼内容,我水平有限正在学习😴
 
 
Back to Top