Learner0x5a's Studio.

Learner0x5a's Studio.

Hello darkeness my old friend.

西方政治思想史读书笔记
政治:众人之事人与政治不可能完全隔绝,公共政策会影响日常生活,政治体制改革会影响一代人的命运。 以共和的视角来看,一个合格的公民应随时准备为政治世界的建设做贡献,由旁观者/思考者变为参与者。政治素养在实践中造就。 古希腊:政治之始斯巴达立法家莱库古改革: 1. 设立元老院 2. 均分土地与奴隶 3. 取消商品交换,采用供给制 4. 优生优育 5. ...... 想到了什么? 雅典王政 -> 贵族政治 -> 僭主政治 -> 民主政治 僭主:武力夺取权力,没有经过合法程序。 伯里克利演说我们爱好美丽的东西,但是不至于奢侈;我们爱好智慧,但不至于优柔。 财富是可以利...
pytorch笔记
官方教程 Learn PyTorch with Exampleshttps://pytorch.org/tutorials/beginner/pytorch_with_examples.html PyTorch Batch训练的一些笔记根据可视化结果,batch size越小,得到的分类边界更精细,收敛更好,但收敛越慢,batch size过小,就会导致震荡甚至无法收敛。batch size越大,收敛越快,但分类边界比较粗糙。 调用指定的GPU直接终端中设定 1CUDA_VISIBLE_DEVICES=1 python3 main.py torch.nonzerotorch.nonzer...
给BERT添加额外的输入/特征/嵌入
给BERT添加额外的输入/特征/嵌入Can we add extra word embedding to the BERT? How to use additional input features for NER? 相关讨论BERT在输入层如何引入额外特征? 为什么Bert的三个Embedding可以进行相加?
中国社会之史的分析
中国社会之史的分析(外一种:婚姻与家族)成书背景:中国社会史论战本书是陶希圣在1928~1937年中国社会史论战中的著作。五四运动之后,马克思主义、唯物史观在中国迅速流行开来; 1927年,国共第一次合作破裂后,中共于1928年7月在莫斯科召开第六次全国代表大会,讨论解决中国社会的性质、中国共产党的革命性质、革命形势、革命任务等问题。 大会决议认为当时的中国社会性质是半殖民地半封建社会,中国革命的性质是资产阶级民主革命,根本任务是反帝反封建。 1928年10月,陶希圣发表《中国社会到底是什么社会》,被认为是中国社会史论战的起点,由此开始,中共、托派、国民党左派开始了关于中国社会史的论战。...
修复ubuntu16.04 Unity图形界面
修复ubuntu16.04 Unity图形界面某台式机Ubuntu 16.04 Unity图形界面损坏,表现为输入口令进入桌面后,只显示壁纸,没有任务栏和菜单栏 修复方式:https://askubuntu.com/questions/760356/ubuntu-16-04-unity-no-desktop-just-background-wallpaper 1234567sudo rm -fr ~/.cache/compizconfig-1sudo rm -fr ~/.compizsudo rm -fr ~/.Xauthoritysudo rm ...
Huggingface笔记
需求1: 自定义tokenizer官方文档给出了很好的说明。 但都是要训练的tokenizer,如果想要实现一个完全自定义的,需要参考这里。 如果无法魔改,那么可以先用自己的方法分完词,用分好词之后的预料训练一个huggingface的WhiteSpace pretokenizer。 wsf:直接自己把token转成id,把id序列给bert即可。(这样不能用huggingface了) 要用huggingface的话,传一个vocab_file给BertTokenizerFast。 或者参考 # Loading from a JSON file 12from transformers i...
ElasticSearch (OpenSearch)
ElasticSearchElasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene™ 基础之上。 Lucene 是当下最先进、高性能、全功能的搜索引擎库。 Elasticsearch 使用 Java 编写,其内部使用 Lucene 做索引与搜索,但是隐藏了 Lucene 的复杂性,取而代之的一套简单一致的 RESTful API。 存储数据到 Elasticsearch 的行为叫做 索引 ,但在索引一个文档之前,需要确定将文档存储在哪里。 \ 一个 Elasticsearch 实例可以 包含多个 索引 ,相应的每个索引可以包含多个 类型 。 这些...
MySQL Note
MySQL的迁移导出.\mysqldump.exe -u root -p database_name table_name > table_name.sql .\mysqldump.exe -u root -p database_name table_name -r table_name.sql 导入mysql -u root -p database_name < table_name.sql 场景:从windows迁移到ubuntu一开始用powershell: .\mysqldump.exe -u root -p database_name table_name >...
机器学习中分类问题的数据均衡
问题:真实世界的数据分布不一定均衡,那为什么大多数ML/DL要做数据均衡?答案:根据场景来决定是否要数据均衡 场景1: 癌症二分类真实数据分布是:绝大多数人没有癌症,极少数人有癌症;如果不做数据均衡,那么一个ML分类器会倾向于把所有样本判断成没有癌症,即全是漏报,没有误报 在辅助医生诊断时,显然是不行的:可以有误报,尽量没有漏报;所以在训练模型时要做数据均衡。 场景2: 英文字母识别真实数据分布不是均匀分布,高频字母例如e,低频字母例如v; 如果做数据均衡,那么训练后的分类器对于每个字母分类错误的概率都是一样的; 如果不做数据均衡,那么训练后的分类器对于每个字母分类错误的概率不一样,错误...
avatar
Learner0x5a
Do not go gentle into that good night.
FRIENDS
jimmy hustcw masf musf