【论文摘要】本文通过对信息时代网络图书馆的发展提出五个方面的建议来阐述未来图书馆的发展构想,从第一要素得人才到构建,使图书馆的发展完全实现适应信息时代的发展方向,保持图书馆最大限度满足读者需求为第一要务的本质不变,彻底改变读者对图书馆得认识,扩大图书馆在社会的影响,提高图书馆在社会中的地位。
图书馆学作为唯一一门以机构名称来命名的学科,其发展速度以及现状并不是很理想,尤其是在我们国内似乎一直都处于低谷状态,我们很少拿出自己的研究成果,很多时候都是借鉴或者说是追随发展的好的国家后面跑。
综观整个现代化的社会,已经实现了网络化,当然伴随而来的网络图书馆也就应运而生,为此,我想提一点关于网络图书馆的建议。图书馆的服务对象越来越向着80后的用户发展,所以更多的要考虑这一代人需要什么样的服务,尤其是网络化的现代图书馆,我们可以从这里受到某些启发。为网络图书馆的发展做些什么,主要做到以下几个方面:
第一,人才是第一要素。我们网络时代的图书馆就是要求有掌握现代化信息管理与分析的全面人才,要彻底改变图书馆工作人员以亲戚朋友为主、只要能搬动书就好的错误观念。图书馆必须进行彻底全面的人事改革,以优厚的待遇吸引更多的优秀人才加入我们的队伍,壮大我们的队伍,创造更加优质、更加现代的服务。我们需要真正掌握高科技的现代化人才,能为图书馆创造更先进的文化、更具特色的体现图书馆建设的现代化服务系统。拥有图书馆学专业的很多高校似乎已经远远的被时代落在后面了,对人才的培养太偏重理论,学生的学习内容过于死板,不能让学生掌握技术层面的东西,这样很不利于学科发展以及未来图书馆服务建设。所以要坚持“走人才强馆”的道路,全面实现图书馆建设的信息化、网络化、现代化,建设一条通往未来图书馆的“信息高速公路”。因此,一定要注意人才培养,制定合理的图书馆学人才培养方针,尤其是开办图书馆学专业的高校更应该为重视学生的技术层面培养。
在今天信息高速增长,技术飞快进步的时代,相信图书馆只要合理、充分的应用,就一定能够走在信息服务产业的前列。
参考文献:
[1]詹德优.信息咨询理论与方法.武汉大学出版,2004,7.
[2]查先进.信息分析与预测.武汉:武汉大学出版社,2000,8.
[关键词]关联主义:社交网站:学习型社交网站
一、引言
社会性网络服务(SNS)是Web2.0时代标志性的网络服务新型模式,它成为连接虚拟网络与真实人际关系的桥梁,也成为人们青睐的新型社交媒体(socialMedia)。“Web2.0是一种新的互联网方式,通过网络应用(WebApplications)促进网络上人与人间的信息交换和协同合作,其模式更加以用户为中心。”Web2.0时代的重大变革是SNS的诞生与发展,最具代表性的就是新一代社交网站(socialNetworkSites,简称SNS)的相继出现,如我们熟知的Facebook、Myspace、Orkut、StudiVZ、skvrock、LinkedIn、Friendster等网站。这些网站作为一种目前非常流行的新型社交媒体,它不仅给信息传播和人际交往带来了超强的影响,并且在教育教学应用中也有着非常大的发展潜力。
本文基于西门子提出的关联主义学习理论来探讨学习型社交网站的设计模型,旨在推动社交网站的教育教学应用,促进教育教学方式革新。
二、社交网站的发展及其特征
(一)社交网站的发展历程
2004年2月4日Facebook上线。Facebook是以社交游戏和实名制交友见长的社交网站,自上线以来,访问量在美国网站总访问量中所占比例远远超越Google,成为美国最大的网站。2006年3月,Twitter创办并于当年7月启动使用。Twitter是国外的一个社交网络及微博客服务的网站。它利用无线网络、有线网络、通信技术进行即时通讯,是微博客的典型应用。它允许用户将自己的最新动态和想法以短信形式发送给手机和个性化网站群,而不仅仅是发送给个人。Twitter是互联网上访问量最大的十个网站之一。2011年5月,人人网融资5亿赴美上市,成为全球首家上市的社交网站。目前人人网有1.6亿注册用户,月度活跃用户数近1亿,已成为国内最大的SNS网站。Google出于各方面的考虑,也于2011年推出其社交网络产品Google+。亚洲流行的社交网站有Orkut、Friendster和Cyword,国内有人人网、开心网等。
数据显示,截止到2011年5月,Facebook用户量已达7亿。加州大学伯克利分校信息学院DanahM.Boyd教授及密西根州立大学NicoleB.Ellison于2008年梳理了主要社交网站发展的简历表,如表1所示,让我们更清楚地认识全球社交网站的发展历程。
(二)社交网站的基本特征
(2)社交网站维系了空间的概念。博客也有空间的概念,但是博客之中,人与人之间的交互是基于(依附于)帖子的。也就是说,有能力记录博客的人占有更多的社会关系,其他沉默的大多数则不拥有明显的社会关系。而大多数社交网站是基于现实社交关系发展出来的,同时也拥有更多种的交互行为来维系社会关系。
(3)社交网站维系了以“人为中心”的多维空间,而博客或者论坛维系的是“以话题或者事件为中心”的一维空间。
(4)社交网站使用一些小游戏将社交的乐趣体现出来。开心网提供了大量的选择题、种菜、足迹等组件。社交网站设计的关键是:要把“好友”们的各种动态广播出来。好友喜欢玩的东西有可能也会刺激我们去玩。好友参与过的事情,有可能也会刺激我们去参与。
三、关联主义视角下的知识建构观
当人类进入信息时代以后,人的学习已经呈现出了极为复杂的变化。学习,原本发生在属于不可见的大脑神经网络中,今天也透过社会网络、计算机网络而外延到更大的范畴中。加拿大学者乔治·西门思(GeorgeSiemens)认为。技术正在改变着我们的头脑,“怎样学”与“学什么”正在被“从哪里学”所补充。技术在改变我们的大脑,知识工具决定了我们的思考方式;组织和个人都是学习的有机体,二者相互影响;以前学习理论所研究的许多学习过程现在可以转交给技术来承担和支持:除了学习程序性知识和事实性知识。更要知道知识在哪里(Know-where)。乔治·西门思(GeorgeSiemens)通过长期的研究实践。于2004年在《关联主义:一种数字时代的学习理论》(Connectivism:ALearningTheoryfortheDigitalAge)一文中提出了一种学习理论——关联主义理论。
该理论认为。“学习就是在一个云雾状网络中。核心要素不断迁移的一个过程,这个迁移的过程不完全受学习者本人的控制:学习(即可付诸行动的知识,actionableknowledge)可以存在于我们自身之外的组织或数据库等实体中:学习就是将不同的信息集合进行连结,这些连结可以让我们有机会学到更多的知识:这些关系(或连结)比我们自身掌握的知识还要重要。”只要人们保持网络的连接,就可以轻松获得经过网络加工的、最新的知识。因此,获得信息、知识的通道比内容本身更为重要,要使自己能够不断地获得知识,最好的方式使自己处于一个适应性的网络关系之中。
乔治·西门思2005年在他的第二篇论文《关联主义:学习就是缔结网络的过程》中对此观点再次做了进一步阐释。总体而言,其理论的核心包括节点(node)、关系/连结(con-nection)和网络(network)。节点是任何可以关联到其它实体的实体。根据乔治·西门思的阐释,节点可以是某个数据、信息、知识或某个人、某个组织、某个子网络等。连结就是两个节点之间建立的一种关系或关联。网络就是诸多节点通过关系形成的聚合和联通。乔治·西门思认为,网络一旦建立,信息(知识)流就在网络中流动,这样不同领域、不同节点之间就连通起来。连结越强,信息(知识)流越快,网络的效率越高。
2005年,乔治·西门思提出了关联主义学习的八条原理。第一,学习和知识存在于各种不同的见解之中:第二,学习就是在不同特定节点或信息源之间建立连结的过程:第三,学习可以存在于非人类的设备上:第四。知道更多的能力比当前知道什么更为重要:第五,要促进持续性的学习就要培育和维护关系;第六,在不同领域、观点和概念之间发现它们的联系是一项核心能力:第七,所有关联主义学习活动的宗旨是保持知识的流通与传播(准确的、最新的知识);第八,决策本身是一个学习过程。选择学习什么以及理解新的信息,都是对变化的客观世界做出调整的过程。
关联主义强调学习过程就是缔结社会知识网络的过程,它表达了一种“分布式认知(distributedcognition)”和“通过关系来学习(1earningbvrelationships)”的理念。费尔德和格兰诺维特都认为拥有许多不同性质关联的人们比起那些只有少数同质关联的人来说,能接触到更多、更丰富的信息。也就是说,在拥有丰富的节点的链接基础上,学习者能够突破限制,在其中纵横驰骋。“对此,还可以运用六度分隔和150法则来进一步做定量分析。假设每一个学习者能够管理跟踪150个不同领域主题的学习节点,那么试想他的知识结构是多么的丰满,由此产生的创造力会有多大”。
所以,学习的关键不在于提供知识,而在于建立社交关系。具体来说。学习就是创建个人社会知识网络的过程:是在不同节点和网络之间建立关系,并将网络中的弱连结变为强连结的过程。只要网络建成,信息便可从一个节点流向另一个节点。进而形成信息流和知识源。知识流在其间得以流动和创造。节点之间的联系越强,信息流动越快,知识越能迅速传播。当知识传播覆盖一定范围时,将会被更多学习者交流讨论,个人通过体验、协商和反思创建节点外部网络,以获得新知识。此时。个体之间可能再次共创知识,也可能单独通过实际行动深入理解知识。并反馈到个人化阶段。行动中创造的知识将以一定的“加工过程”继续流动循环,如图1所示。
四、学习型社交网站的创建
“一个人的学习不是取决于你个人独立的个体存在而是取决于你的社会性存在”,换句话说,社会网络对一个人的学习至关重要。特别是在技术已经变革我们的生活、交流与学习方式的时代,帮助人们建立关系,并能形成互动的社交网络,这是关联主义对于学习型网站设计最大的启示。
(一)技术维度
(二)社会维度
乔治·西门思在强调学习者个体与学习内容关系的同时。也认为社会、社区和同学对学习有重大作用。一方面,学习是一个非正式的、以连接为基础的、网络创建的过程,我们需要重新思考如何设计教育指导。才有利于培养学习者驾驭信息的能力。另一方面,学习环境影响网络的形成,因此,我们必须保持网络的健康性,并考虑如何设计才能有效促进学习。
1.目的
网站的设计本该目标明确,鉴于目前已上市的学习型社交网站无论是技术功能、学习支持还是创新程度都还有待提高,因而本文构建出相对理想的模型。该平台旨在创建共享知识,传递最新资讯,并在最大程度上帮助用户解决因链接冗余、信息杂乱而导致的捕捉关键信息困难的问题,有助于用户在各领域知识节点之间建立连接,形成概念网络,进而保证用户能够从技术、资源、管理上都获得最佳体验。
2.身份
举一个具体的例子:某个体充当小组发起人,通过“我的团队”组建一个爱好摄影的小组,该小组可建立自己的工作制度,如每位成员按天轮换,工作内容是到平台答疑区回答用户关于摄影的提问,要求回答尽可能专业,工作完成后可以获得相应的经验值和金币。随着经验值增加,成员获得了高级用户权限。可以选择更为优质的资源对平台中缺乏、陈旧的材料进行补充和替换,也可以定期将资源进行归类整理,与此同时仍然能够浏览信息。显然,用户的身份已经从刚开始的纯粹学习者变成了网站的管理员,不仅具有多重身份,还获得了较高职权。
3.关联
4.易于使用和整合
5.社交性
6.生命/活动
7.多样性
网站应该考虑保留用户观点的多样性。在法律允许的范围内鼓励奇思妙想,不存在边缘性想法,当观点被多数用户采纳或转发时便会获得支持感和自身价值,且用户发言越诚实,支持率就越高。
(三)知识维度
乔治,西门思认为知识正在发生巨变,变革主要体现在两个方面:知识存在的情境(或环境)和知识自身的流动和特征。知识正在从网络、生态方向发展,关联性知识是关联主义的认识论基础。因此,要把握住知识循环流动的过程和关联性知识的内涵,才能建立合理科学的学习型社交网站。
1.学习型社交资源设置
总之。基于学习型社交网站的资源设置核心不外乎四点:一是信息的实时更新,二是较强的知识性,三是实用价值,四是适当的关联。
2.学习型社交网站的知识关联模型
前文已经提到,知识需要经过创造、共创、传播、交流、个人化、实施和再创造的循环流动过程。虽然知识流动循环理论具有很大的普遍性,但是仅凭这些抽象的要素以及原则是不能指导人们实践的。就关联主义知识观的本质而言,知识流动循环可以简单地理解为主体与环境之间利用工具进行信息创造、交换和提取的过程。根据知识流动循环模型、网络学习行为的基本特点以及平台提供的技术支持,对基于学习型社交网站的知识关联过程进行理论模型建构,如图2所示。
(2)资源丰富、更新速度快、链接冗余少。今日热点和本站新讯彰显模型的独特之处。它们不同于以往信息资源,表现在内容丰富、信息实时更新、知识性较强、链接冗余少,并具有一定的实用价值。最新笔记和问答分别增强了知识的深度和广度,对用户同样具有吸引力。
(3)学习环境提升用户黏度。当前的学习平台几乎未曾考虑过知识转换系统的价值,但其实学习环境对学习发挥着巨大作用。该模型基于关联主义观点。从七个关键因素出发,建立基于学习型社交网站的学习环境,即能满足用户的学习、社交需求,又能提升用户黏度。
五、总结
【关键词】中文分词;知识体系;关键词标注
【中图分类号】G420【文献标识码】A【论文编号】1009―8097(2009)12―0087―04
一问题的发现
尽管Web2.0已经提出了对信息标记和管理的方法、思想,而且Tag和RSS的思路也已在某些Blog中有所体现。然而,由于其标注关键词和超级链接管理都非常注重普适性,并不是面向学科教学的,因此在实际的教学应用中仍存在标注不够便利、对普通学生要求较高、其关键词并没有完全面向学科教学等缺点。
为此,笔者认为:在对教学平台论坛(或Blog)的管理过程中融入知识科学的文本聚类思想,使教学平台能够针对学科知识特点,选取特定的词汇作为特征向量,探讨知识点之间的联系,自动形成基于知识点联系的知识网络图,对于提高教学平台的服务水平、促进学习者积极地进行意义建构是具有重要意义的。
二系统设计的指导思想
探求解决上述问题的方法,其关键是解决对帖子的分析、聚类问题,即探索一种算法,解决如何依据帖子所反应的知识内容,为大量帖子建立基于知识体系的横向关联的问题。
1指导思想
(1)选择适当的词汇库作为基础语料库,并要求学科教师根据学科的特点组织专有名词、专业术语丰富基础语料库,作为实现分词的依据。
(4)利用动态网站设计的有关技术(或JSP),以可视化的方式呈现帖子之间的逻辑关系。
从当前文本聚类分析的技术发展来看,文本聚类分析已经发展成为一项具有较大实用价值的技术,其目标是在分析文本内容的基础上,按照预先定义的文本类别,使多篇文本被自动归类。由于英文以单词作为语言的基本单位,每个单词表示一个固定的语义,每两个单词之间都有相对固定的分隔符号。因此基于英语文本的聚类分析不需要考虑单词的划分问题。与英文的聚类研究不同,中文以汉字作为文字的基本单位,以词语作为语义的基本单位,不同的汉字被组织起来形成语义不同的词汇,而且在汉语形态的句子中词汇之间没有专门分隔符号。因此在中文环境下实现文本聚类分析的前提是分词,即把一个句子分隔成为若干个词汇,然后再通过分析、计算词汇描述的语义,实现文本的聚类。
从分词算法来看,现有的分词算法有三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。比较上述三种方法,基于词表最大匹配的分词方法具有程序实现简单、开发周期短的特点,尽管其分词准确率仅有95%左右,但已基本能够满足本研究的要求[2]。因此,笔者决定采用这种分词方案。
由于传统的VSM在舍弃了各关键词汇在文档中的顺序关系之后,可以把文档简单地表征为由关键词汇表示的向量空间中的点的集合。因此,只需通过计算两个文档的向量集内部点之间的距离就能确定文档类别的归属。然而研究发现,以文本向量空间模型对文档进行初步表示以后,用于表达文本内容的向量空间的维数很大,甚至可以达到几万维,导致分类算法的计算量太大,而且过高的维数导致无法准确地提取文档的分类信息。因此,降维是提高分类算法效率并提高其分类准确率的重要手段。在这一思想的指导下,选择特征项并设置特征项在分类算法中的权重是文本聚类中常见的手段。其中文档频率、X2统计(CHI)是其常用的算法,而互信息算法(MI)的理论研究也有重要的应用价值[4]。
三系统算法与实施
1传统论坛的数据结构
论坛中的帖子一般可分为两大类,一类是主帖,一类是针对主帖的回帖。在传统的论坛中,仅需保存帖子的内容及其与回帖之间的关系即可,因此其数据存储结构非常简单。论坛帖子表的存储结构通常如表1所示。
表1论坛帖子的存储结构
在论坛中,所有帖子都有一个唯一的主ID号,主ID由DBMS自动生成,用于唯一地标记这个帖子。主帖的副ID号为0,用于标记这是一个主帖。而所有的回帖都直接使用被回复帖的“ID号&副ID号”作为自己的副ID号。由于副ID号采用不定长的特征码表示方法,因此可利用副ID号区分当前帖子是对主帖的直接回帖,还是对回帖的回帖。
本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文
2对传统论坛数据结构的改进
为了能够实现对论坛内容的分词处理并记录帖子之间的内在联系,拟在传统数据结构的基础上,增加两个数据表。
(1)帖子关联度表
为了能有效地表示出各个帖子之间的知识关系,把他们组织到一个知识体系中,在上述数据结构的基础上,首先要增加一个新数据表:帖子关联度表。其结构如表2所示。
表2帖子关联度的存储结构
帖子关联度表的作用是记录帖子与各个关键词之间的关联度情况。
(2)词表
在文本分词和聚类过程中,基础性的工具是分词所依据的语料库。在本研究中,笔者设计了如表3所示的数据表,作为词表的基本结构。
其中,词汇ID可由系统自动生成,是词汇的唯一性标记;词汇内容项用于保存常用的词汇、学科的专业术语和专业名词;频度项用于记载当前研究的文本中对应词汇出现的频度,默认值为0;词汇的权重项则用于说明该词汇在学科中的重要性程度,默认值为1,最高值为5。
另外,为了标明帖子是否已经被分词处理或关联度标注,在帖子表中增加一个新字段“处理状况”。对于已经进行过关联度标注的帖子,标记为“已处理”。
3准备词表
(1)构造基础词表。构造基础词表的首要任务是选择一个应用较广泛的语料库内容作为基础词汇,并把语料库的内容填写到词表(表3)的词汇字段中。
(2)丰富词表。要求学科教师根据学科的知识体系、教学内容构成、知识点的重要程度等要素,把学科教学中常用的术语、专有名词、具有特定语义的描述方法,添加到词表中。
(3)优化调整词表。为了保证系统标注的效率和专用术语的完整性,首先调整一些虚词、助词的权重为0;然后强化专业术语的权重级别,使专业术语能够优先被标注。因此可根据专业词汇的重要性程度,分别给予2~5级的权重。最后按照“权重(升序)”+“字符串顺序(降序)”对词表排序。
通过上述处理,能保证专业术语和长字符串被优先标注,保证了诸如“北京师范大学”之类的专有名词不会被拆分为“北京”、“师范”、“大学”等多个词汇。
4文本分析与标注算法
(1)获取待处理数据
首先从表1所示的帖子表中获取一条“处理状况”为空的记录,从中提取其字段“内容”的值,存储到变量X中,并记下该帖子的主ID号和副ID号。
(2)逆向匹配处理
按照如图1所示的算法,实现对文档的逆向匹配处理。
图1逆向匹配处理算法的N-S图
(3)登记匹配结果
首先按照公式“计算值=权重×频度”对词汇表进行计算,求取本帖内容中用到的各个词汇的最终重要性程度,把计算结果存储到词表的“计算值”字段中,最后按照计算结果对词表进行降序排列。通常需要根据帖子的长度、反应词汇重要性程度的计算值等数据,确定哪些词汇及其频度值需要纳入到关联度表(表2)中。在本研究中,笔者选择了公式“文本长度×0.01+词条重要性程度×0.2”作为衡量词条关联度水平的标准。最后在帖子表(表1)中,把本帖的字段“处理状况”标记为“已处理”。
(4)显示分析结果
根据关联度表格中记录的帖子与关键词条的关联度状况,在动态网页中通过文本超级链接、图像Map技术等建立帖子与知识点之间的链接关系,从而把师生在教学服务平台中的讨论情况纳入到教学知识体系中,以可视化的形态提供给学习者。
四系统运行与评价
1系统运行说明
2运行效果
为了更清晰地说明本算法的运行状况,本文仅以高中物理教学的学生论坛为例进行简要说明。图2是进行关键字标注前的论坛的讨论界面。图3是已经进行了关键字标注后的论坛讨论界面。
图2没有进行关键字标注前的论坛界面
图3已经进行了关键字标注后的论坛界面
图4匀变速直线运动的直线网络图
3算法运行状况评价
由于算法基于数据库实现,因此在算法实现中可以充分地利用DBMS自身提供的各类优化算法提高程序的执行效率,从而有效地降低程序开发的复杂度。
本算法允许教师用户在应用系统过程中不断优化其知识体系结构。首先,教师可以在使用系统过程中不断地调整和完善词表,在教师认为必要的情况下,允许他们清除所有帖子的处理状况信息,从而重建所有的关联信息。其次,由于本算法建立在分词算法的基础上,能够在系统运行过程中不断地收集没有匹配成功的单字,研究单字之间是否存在联系,进而发现针对该学科遗漏的重点词汇,并利用它们逐步地完善词表。
4本研究的不足
五总结
――――――――――
参考文献
[1]马秀麟,白凤凤.基于知识管理的网络学习资源的组织[J].中国教育信息化,2007,19:60-62.
[2]贺艳艳.基于词表结构的中文分词算法研究[D].北京:中国地质大学,2007.
[3]丘志宏,宫雷光.利用上下文提高文本聚类效果[J].中文信息学报,2007,(11):109-115.
[4]李小红,许少华.基于模糊向量和BP网络的Web文本自动分类方法[J].福建电脑,2006,(2):94-95.