组会记录
2020年2月14日
2020年2月21日
可能的查询任务从两方面考虑:
一段长时间内的heavy hitter检测。
多个交换机(甚至跨地域)的数据协同查询。
目前主要考虑1。也可关注相关论文内的有关问题。
关于数据平面的测试:
实验时,可以考虑l=64,即flowkey只包含源和目的IP的问题。
2020年2月28日
下一步考虑使用树状结构存储小时间间隔下的Sketch,用以支持不同时间间隔的查询。
2020年3月6日
继续之前的任务:
2020年3月13日
尝试实现朴素方案,进行实验找出需要改进问题。
分析CAIDA数据集中的流分布情况。
继续考虑树状存储结构。
2020年3月20日
2020年3月27日
测量FlowRadar数据平面的带宽等数据。
考虑并整理存储系统部分的需求。
2020年4月10日
20204月11日
2020年4月17日
继续实现最基本的存储方法。
考虑为什么要这么做,这么做的开销。
特别是Hash表的(内存)开销有多大。
数据一致性、可靠性的问题。
2020年4月24日
关于测量:
design的overhead:hash表的内存开销,CPU开销
系统性能测试:两种查询:吞吐延迟 (workload构造:数据生成的速度,目标:系统最好边界:多大带宽的网络流的测量数据存储多大时间尺度)
还有数据插入的性能(吞吐和延迟)
对比baseline:把存储格式抽象出来:流格式,数据库mysql?rocksdb?大文件Ext?
baseline:上界对比,即和完全在内存中的情况进行对比
一些应用case的测试,黄群老师Paper中的一些应用的测量
2020年10月16日
重新启动。
进度记录
2月16日:建立本站。
2月18日:阅读SketchLearn。
2月19日:成功运行SketchLearn开源代码。
2月27日:初步完成SketchLearn代码修改,进行I/O测试。
3月 8日:阅读FlowRadar。
3月 9日:阅读ElasticSketch。
3月11日:阅读UnivMon、SketchVisor。
3月12日:设计朴素的存储系统方案。
4月 7日:完成了对FLowRadar的一系列测量。
4月23日:完成了使用时间戳作为Key + Hash表存储流出现时间信息的简单存储系统。
|