语言与文化资源库昨正式上线了。
江苏人说普通话有些“难点”
N、L不分
(把“南”念成“蓝”)
平舌翘舌不分
(把翘舌音念成平舌音)
两种情况都有
“膜拜啊,能把‘男男女女喝牛奶’念成‘蓝蓝吕吕喝流来(读第三声)’”,这是网上最流行的笑话南京人普通话不标准、N和L不分的段子。江苏“语言与文化资源库”(http://jsyy.jsjyt.edu.cn/)昨日正式开通。经过我省专家5年的努力,这个库收录了时长超过320小时、数据容量超过830GB的方言及地方普通话有声数据。有趣的是,专家们用数据为南京人“正名”:N、L分不清的区域分布很广,北到连云港南到无锡,江苏二三十个县市都存在这种现象呢!
新闻背景
为啥要建资源库?保护原汁原味方言!
为了保护原汁原味的方言,江苏承担起“中国语言资源有声数据资源库”试点建设,通过各地区方言发音人朗读单词、词组、讲故事、日常对话等形式建立语料库。记者了解到,该资源库在全国是第一家。
资源库建立时间表
●2008年8月13日,省语委确定苏州为首批试点地区。
●2008年10月至2009年3月,省语委组织苏州市语委以及南京大学、南京师范大学、苏州大学等3所高校调查团队对国家试点领导小组提供的调查内容又作了研讨和补充。3个调查团队在苏州市区、常熟市、昆山市等3个首批试点地区开展调查。
●2009年10月12日,第二批试点地区共12个。即苏州张家港市、太仓市、吴江市;南通市区、启东市、海门市、如皋市、如东县、海安县;南京高淳县;扬州市区;泰州市区。
●2010年10月,江苏第三批语言资源调查工作正式启动。调查点包括南京、无锡、徐州、常州、南通、扬州、镇江、泰州等8市共32个点,承担调查工作的专家团队增至8个。
●2010年12月,省语委建设的“江苏语言资源有声数据库展示网”试运行。
●2011年11月,国家语委科研规划领导小组办公室向我省下达重点项目《语言资源有声数据库的构建与Web检索》。
●2013年9月11日“江苏语言与文化资源库”正式开通。
资源库是怎么建的?
全省设70个点“抢录方言”
“我的孩子不会讲南京话了,他和同学说普通话,上课听普通话,看电视都是普通话,南京话顶多撇两句了。”很多70后、80后家长都有同感,90后、00后这一代孩子,会说方言的人越来越少。“我们的方言还是挺有魅力的。”江苏省教育厅语工处处长赵晓群介绍说,为了“抢救方言”,20008年,国家语委启动“中国语言资源有声数据库”建设,由我省独家承担该数据库建设试点工作。记者了解到,在江苏境内大致有三种方言,长江以南是吴方言区,长江以北至淮河两岸是江淮官话方言区,淮河以北约一百公里外是中原官话方言区。江苏境内的吴方言主要属太湖片。全省使用吴方言的人数接近总人数的25%,典型的吴方言以苏州话为代表。江淮官话分属洪巢片和泰如片,使用人数接近全省总人数的57%。中原官话分属洛徐片和郑曹片,使用人数约占全省总人数的18%。
“苏州作为吴方言区的代表被国家语委和省语委确定为首批试点城市,苏州话成为第一个进入中国语言资源有声数据库的方言。2008年至今,全省设立了苏州、南京、宿迁、如皋等70个调查点。其中江淮官话41个点,吴方言19个点,中原官话10个点。”
方言发音人各地“大海选”
苏州话、南京话,究竟谁说的话最能代表一方调调、最有发言权呢?“每个点都进行海选,条口很‘苛刻’。”比如苏州市对发音人的年龄段有严格的限制,老年(1941年~1950年出生),必须在苏州出生和长大,家庭语言环境单纯,没在外地长住,能说地道的苏州话。同时,具有小学或中学以上文化程度,反应能力较强。中年(1956年~1965年出生)组和青年(1971年~1980年出生)组的发音人,要求则更高,既要求是方言发音人,又是地方普通话发音人。这就要求发音人不仅要在苏州出生和长大,家庭语言环境单纯,没在外地长住,能说地道的苏州话,而且普通话水平也要达到一定的要求。
南京市征集4名南京城区方言发音人,同时征召3名南京“城区”地方普通话发音人。在海选要求中加入了不抽烟、牙齿整齐等条件。南京著名节目主持人老吴则毛遂自荐,因为年龄不合适遗憾“落选”。“发音人海选出后,将分别完成最具代表性的方言录音,其中包括常用字、词汇、短句的读音,以及讲故事、风俗等,永久保存在中国语言资源有声数据库。”赵晓群说。
苏州大学文学院教授汪平参与了语言文化库的建设,让他担忧的是,收集过程中,部分地区尤其是苏北地区,随着农村城镇化的进程,想找到一个纯真的“方言发音人”有些难,苏南一些地区,方言中部分词语也正受到普通话的同化,“苏州话里分尖、团音,如果你没把大小的‘小’说成‘siao’,而是说成‘xiao’,老苏州人肯定受不了,认为你苏州话没学会,还不算苏州人,其实50岁以下的苏州人都已经不会说了,这就是一种濒危的现象,完全恢复到原来一样是不可能的。我们要用科学的方式来保存以前的曾经存在的现象。”
汪平认为,“语言文化库”的建立是对方言科学地保护,并非恢复原貌,让孩子们去学以前的方言。
“市骂”也录了但没存进语言库
“录方言时,开始我们的确录了‘市骂’,类似于北京话里的‘他妈的’的意思,在江苏和这三个字有关的方言通常会涉及到性器官。”江苏师范大学苏晓青教授坦言,最终“市骂”并没有存入语言库。“虽然这些语言也是方言的一部分,但专家组经过讨论还是认为这些词句不够尊重,不应该列入被保护的范畴。”汪平教授认为,应该引导公众少用这类词语,“我注意到最近有两派声音,一派是冯小刚导演春晚抵制‘吊(音)丝’等不文明用语,另一派不少电视名嘴挺‘吊(音)丝’用得挺溜。我赞成冯小刚导演的做法,江苏方言里有个经典的市骂‘傻×’,通常我们写的时候用×或者逼迫的逼来替代,而不是赤裸裸的用原字。‘吊(音)丝’也是一样的道理,用原字太粗俗了。”