Chen Jun, an MA Student at Central China Normal University, has created Chinese-language materials including a training guide and Powerpoint decks explaining how to use R to analyze the CGED-Q JSL Public Releases.
Chen Jun created these slides while serving as my TA for a graduate class at CCNU in fall 2022 in which students learned about ongoing ‘big data’ studies in Chinese history, and then did final projects in which they used R to conduct analysis fo the CGED-Q JSL on a topic of their choice. The slides explain how to import the downloaded CGED-Q JSL files into R, create and transform variables, parse strings, and tabulate and graph results.
In summer 2023, he distilled the material in the slides into a training guide with examples.
Here is his summary in Chinese:
以上材料是R语言的基础教程,内有教学PDF和R语言代码包。此教程主要包含Rstudio的界面简介、变量创建、数据转换、制作图表、数据集链接等内容。此教程所利用的材料是由李中清-康文林团队辑录的中国政府雇员数据库—清代(China Government Employee Database-Qing,简称CGED-Q)中的缙绅录数据库(JSL database 1900-1912;1850-1864)。JSL数据库是一个超大型字符串类型数据库,目前国内尚未有系统性的针对大型字符串类型数据库的R语言教程,此教程是初次尝试,供广大R语言使用者、初学者参考。
此教程的作者是陈俊,华中师范大学硕士研究生;联合作者是康文林,香港科技大学和华中师范大学教授。另外,韦圣彬在此教程的制作中提供了莫大的帮助,特此感谢。此教程主要是作者根据数据库处理经验并参考部分网络资源(已标明出处)制作而成的,如果有使用者发现有任何未注明引用的地方,请联系作者删除。此教程是一个初步的尝试,在技术层面和组织层面都存在着问题,恳请广大读者和使用者批评指正。
在Rstudio中打开R语言程序包,有的使用者可能遇到出现乱码的问题,具体的解决方法是:依次点击File—Reopen with encoding—UTF-8即可。
Training Guide
R语言在历史数据库分析中的运用——以《缙绅录》数据库为中心的基础教程 (PDF)