-
簡介:創(chuàng)市語言文字規(guī)范化示范校培訓(學生),東莞市塘廈鎮(zhèn)林村小學,中華人民共和國國家通用語言文字法中華人民共和國國家通用語言文字法已由中華人民共和國第九屆全國人民代表大會常務委員會第十八次會議于2000年10月31日通過,現予公布,自2001年1月1日起施行。中華人民共和國主席江澤民2000年10月31日第一章總則第一條為推動國家通用語言文字的規(guī)范化、標準化及其健康發(fā)展,使國家通用語言文字在社會生活中更好地發(fā)揮作用,促進各民族、各地區(qū)經濟文化交流,根據憲法,制定本法。第二條本法所稱的國家通用語言文字是普通話和規(guī)范漢字。第三條國家推廣普通話,推行規(guī)范漢字。第四條公民有學習和使用國家通用語言文字的權利。國家為公民學習和使用國家通用語言文字提供條件。地方各級人民政府及其有關部門應當采取措施,推廣普通話和推行規(guī)范漢字。第五條國家通用語言文字的使用應當有利于維護國家主權和民族尊嚴,有利于國家統(tǒng)一和民族團結,有利于社會主義物質文明建設和精神文明建設。第六條國家頒布國家通用語言文字的規(guī)范和標準,管理國家通用語言文字的社會應用,支持國家通用語言文字的教學和科學研究,促進國家通用語言文字的規(guī)范、豐富和發(fā)展。第七條國家獎勵為國家通用語言文字事業(yè)做出突出貢獻的組織和個人。第八條各民族都有使用和發(fā)展自己的語言文字的自由。少數民族語言文字的使用依據憲法、民族區(qū)域自治法及其他法律的有關規(guī)定。,第二章國家通用語言文字的使用第九條國家機關以普通話和規(guī)范漢字為公務用語用字。法律另有規(guī)定的除外。第十條學校及其他教育機構以普通話和規(guī)范漢字為基本的教育教學用語用字。法律另有規(guī)定的除外。學校及其他教育機構通過漢語文課程教授普通話和規(guī)范漢字。使用的漢語文教材,應當符合國家通用語言文字的規(guī)范和標準。第十一條漢語文出版物應當符合國家通用語言文字的規(guī)范和標準。漢語文出版物中需要使用外國語言文字的,應當用國家通用語言文字作必要的注釋。第十二條廣播電臺、電視臺以普通話為基本的播音用語。需要使用外國語言為播音用語的,須經國務院廣播電視部門批準。第十三條公共服務行業(yè)以規(guī)范漢字為基本的服務用字。因公共服務需要,招牌、廣告、告示、標志牌等使用外國文字并同時使用中文的,應當使用規(guī)范漢字。提倡公共服務行業(yè)以普通話為服務用語。,第十四條下列情形,應當以國家通用語言文字為基本的用語用字(一)廣播、電影、電視用語用字;(二)公共場所的設施用字;(三)招牌、廣告用字;(四)企業(yè)事業(yè)組織名稱;(五)在境內銷售的商品的包裝、說明。第十五條信息處理和信息技術產品中使用的國家通用語言文字應當符合國家的規(guī)范和標準。第十六條本章有關規(guī)定中,有下列情形的,可以使用方言(一)國家機關的工作人員執(zhí)行公務時確需使用的;(二)經國務院廣播電視部門或省級廣播電視部門批準的播音用語;(三)戲曲、影視等藝術形式中需要使用的;(四)出版、教學、研究中確需使用的。第十七條本章有關規(guī)定中,有下列情形的,可以保留或使用繁體字、異體字(一)文物古跡;(二)姓氏中的異體字;(三)書法、篆刻等藝術作品;(四)題詞和招牌的手書字;(五)出版、教學、研究中需要使用的;(六)經國務院有關部門批準的特殊情況。,第十八條國家通用語言文字以漢語拼音方案作為拼寫和注音工具。漢語拼音方案是中國人名、地名和中文文獻羅馬字母拼寫法的統(tǒng)一規(guī)范,并用于漢字不便或不能使用的領域。初等教育應當進行漢語拼音教學。第十九條凡以普通話作為工作語言的崗位,其工作人員應當具備說普通話的能力。以普通話作為工作語言的播音員、節(jié)目主持人和影視話劇演員、教師、國家機關工作人員的普通話水平,應當分別達到國家規(guī)定的等級標準;對尚未達到國家規(guī)定的普通話等級標準的,分別情況進行培訓。第二十條對外漢語教學應當教授普通話和規(guī)范漢字。第三章管理和監(jiān)督第二十一條國家通用語言文字工作由國務院語言文字工作部門負責規(guī)劃指導、管理監(jiān)督。國務院有關部門管理本系統(tǒng)的國家通用語言文字的使用。第二十二條地方語言文字工作部門和其他有關部門,管理和監(jiān)督本行政區(qū)域內的國家通用語言文字的使用。第二十三條縣級以上各級人民政府工商行政管理部門依法對企業(yè)名稱、商品名稱以及廣告的用語用字進行管理和監(jiān)督。第二十四條國務院語言文字工作部門頒布普通話水平測試等級標準。第二十五條外國人名、地名等專有名詞和科學技術術語譯成國家通用語言文字,由國務院語言文字工作部門或者其他有關部門組織審定。,第二十六條違反本法第二章有關規(guī)定,不按照國家通用語言文字的規(guī)范和標準使用語言文字的,公民可以提出批評和建議。本法第十九條第二款規(guī)定的人員用語違反本法第二章有關規(guī)定的,有關單位應當對直接責任人員進行批評教育;拒不改正的,由有關單位作出處理。城市公共場所的設施和招牌、廣告用字違反本法第二章有關規(guī)定的,由有關行政管理部門責令改正;拒不改正的,予以警告,并督促其限期改正。第二十七條違反本法規(guī)定,干涉他人學習和使用國家通用語言文字的,由有關行政管理部門責令限期改正,并予以警告。第四章附則第二十八條本法自2001年1月1日起施行。,,我們都要做的事情1、同心同德,重視評估工作。2、上好課、說普通話、寫規(guī)范字。3、熟悉評估的內容和程序。4、有關工作的負責人按進程表完成。,迎接評估,讓我們一起努力,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 8
大?。?0.29(MB)
子文件數:
-
簡介:跨境語言,什么是跨境語言我國的跨境語言民族心理影響跨境語言研究跨境語言的意義,什么是跨境語言,含義產生原因主要特點,跨境語言的含義,跨境語言是指分布在不同國境中的同一語言??缇痴Z言可作廣義和狹義兩種理解。廣義的跨境語言包括接壤以及不接壤國家在內的同一種語言。比如,英國英語和美國英語;中國的漢語和新加坡的華語;中國的苗語和分布在美、加的苗語。等等。狹義的跨境語言是指相接壤的不同國家中的同一種語言。比如朝鮮語(主要分布在朝、韓以及中國的吉林延邊朝鮮族自治州)。,產生跨境語言的原因,民族和國家不是一個概念。同一民族或說同一母語者可能跨國境定居,成為跨境族群,因此,他們使用的語言就成為跨境語言。,跨境語言的主要特點,1)跨兩國或跨多國2)境內多或境外多3)同名或異名4)相鄰或不相鄰6)差別小或差別大5)形成時間長或時間短,跨兩國或跨多國,比如怒語、獨龍語跨中緬兩國;傣(泰)語跨中、越、老、緬、泰五國。,境內多或境外多,比如哈尼語在中國境內的使用人口達125萬多,而在越南只有9千5百多人;朝鮮語在朝、韓兩國使用人口超過6200萬,而在中國只有192萬多。,同名或異名,大多數跨境語言的名稱是一致的,少數不一致,如中國景頗族把他們的語言叫做景頗語,緬甸則稱之為景頗語或皮欽語;國際上皮欽語的稱謂更通行。,相鄰或不相鄰,相鄰的如蒙古語;朝鮮語等等。不相鄰的如中國苗語和美國苗語,等等。,差別小或差別大,差別小的如中國的景頗語和緬甸的景頗語;差別大的如中國的傣語和泰國的泰語。,形成時間長或時間短,形成時間長的如英語和德語由原始日爾曼語分化而來。起初,說英語的先民盎格魯-撒克遜、朱特等部落居住在今天的荷蘭、丹麥等地,后遷英倫三島,漸漸與中歐地區(qū)的日爾曼人減少往來,語言差別日益擴大,成為今天的英語和德語這兩種獨立的語言。形成時間短的如中國西南地區(qū)與越、老、泰、緬等國的國界都是19世紀末、20世紀初才劃定的,而該地區(qū)的跨境語言隨國界劃定而形成,距今不過100多年歷史。,我國的跨境語言,1、概況中國56個民族中,有28個民族的語言是跨境的,如蒙古、藏、維吾爾、朝鮮、哈薩克、苗、瑤、壯、傣、哈尼、景頗、怒、獨龍、佤、京等民族的語言。2、重要的跨境語言3、跨境民族的雙語現象,重要的跨境語言,1)藏語是政治敏感性語言。2)蒙古語是信息技術國際領先的跨境語言。3)哈薩克、柯爾克孜語是中亞地區(qū)有潛在影響的語言。4)彝語、傣語等業(yè)已成為我國民族語文現代化所關注的重點語種。,跨境民族的雙語現象,我國跨境民族的雙語現象往往受境外同一民族的影響,兼用境外主體民族的語言,比如1)建國前,維吾爾、烏孜別克等分布在新疆北部邊界的民族,有一些人掌握了俄語和俄文。2)20世紀初,一些維吾爾族出外經商的人受國外現代教育的影響,回國后就在喀什、阿圖什、吐魯番、伊犁等地辦起了新式小學,這些學校還聘請土耳其、俄國的知識分子任教。3)與緬甸相鄰的云南傣族和景頗族等,有一些人學會了緬語和緬文。20世紀40年代,云南景頗族中有一些人到緬甸仰光、曼德勒等城市求學,他們不僅學會了景頗文,還學會了緬語文,成為景頗族最早的知識分子。,民族心理影響跨境語言,屬于同一民族而分布在不同國家的跨國語言,在使用什么文字的問題上,民族心理是趨向一致的。比如1)苗族除了在我國主要聚居分布外,在東南亞的越南、老撾、泰國、緬甸、菲律賓以及美國、法國和加拿大等國都有分布。海外的苗族大都是移民造成的。2)國外苗族主要使用苗語川黔滇方言,由于不同國家在政治、經濟、文化上存在不同特點,國內外苗語各有特點,在文字上也存在差異。可以預測,這種差異在今后還會擴大。但是,不同國家的苗族普遍存在“求同心理”,希望世界上不同國家的苗族加強交流,通過相互學習來縮小差別,促進彼此的發(fā)展。他們還希望共同使用一種文字。當然這樣的愿望至少在近期難以實現,因為語言文字的分化和統(tǒng)一要受到各種條件的制約,而且語言文字無論是分化還是統(tǒng)一都要經歷一個長期的過程。,研究跨境語言的意義,1、從語言學角度說,研究跨境語言可以為語言變異研究提供一個全新的視角,為語言變異理論補充新的內容。2、從民族學角度說,研究跨境語言對解決跨境民族的族源問題有很大的幫助。3、從語言政策角度說,研究跨境語言,對邊疆地區(qū)民族語文政策的制定、工作的實施有重要的實用價值。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 16
大小: 0.24(MB)
子文件數:
-
簡介:第八章漢語作為第二語言的測試,主講人遼寧師范大學趙越,第八章漢語作為第二語言的測試,知識點1,知識點2,語言測試題目編寫和分析方法,知識點3,語言測試的發(fā)展階段與基本類型,語言測驗的開發(fā),語言測驗的質量評估,知識點4,知識點1語言測試的發(fā)展階段與基本類型,11語言測試的發(fā)展階段,第一階段傳統(tǒng)時期或前科學時期,第二階段心理測量結構主義時期或科學時期,第三階段心理語言學和社會語言學時期或后現代時期,第四階段交際法語言測試時期,?中國在第二語言測試方面,直到20世紀70年代末,80年代初美國TOEFL考試等國外標準化語言測試傳到中國,我們才開始重視第二語言測試的研究,并開發(fā)出“英語水平考試EPT”,“大學英語考試CET”等標準化的語言水平考試。1984年研發(fā)出專門用來測試母語非漢語者漢語水平的標準化語言測試漢語水平考試HSK。研究人員已經開發(fā)出HSK基礎,HSK初中級和HSK高等三個等級水平的系列考試,是我國目前最具權威性的漢語作為第二語言的國家級標準化考試。,?語言測試作用,語言教學方面包括評價學習者的學業(yè)成就和語言水平,評估教學的實際效果,為選拔人才提供依據,為改進教學中的問題提供反饋等。語言研究方面為語言研究包括語言教學研究提供信息,語言測試作為一種測量工具,是語言研究和語言教學研究的一個重要手段提供實證性數據,為有關語言能力的假說證實或證偽。,12語言測試的基本類別,121幾種不同用途的測驗122主觀性測驗和客觀性測驗123分立式測驗和綜合式測驗124標準化測驗和非標準化測驗,121幾種不同用途的測驗成績測驗(ACHIEVEMENTTESTS)又叫學業(yè)成就測驗,在教育測驗中運用最廣。其最重要的一個特點就是教什么測什么,學什么測什么,甚至是怎么教就怎么測。目的是了解學生究竟掌握了什么內容。是一種回顧性的測驗,它所測試的內容不應超出學習者已經學過的內容范圍。如單元測驗、期中期末考試、畢業(yè)考試等。,121幾種不同用途的測驗,水平測驗又稱熟巧程度測驗,它考查的是學習者綜合運用語言的能力,關心學習者是否可以聽懂目的語者講話,是否可以看懂用目的語所寫的文章,是否可以用目的語與別人自如地進行口頭或書面的交流。如TOEFL、HSK、WSK等。,?水平測驗與成績測驗的區(qū)別水平測試驗的測試內容不以特定的教學大綱、教學課程或教學方法為依據。只關心能否完成任務。水平測驗不像成績測驗那樣有十分明確的測試內容范圍,但也并不是隨意的,是在需求分析基礎上確定命題原則、制定命題大綱和命題細則,然后編制測驗題目。,能力傾向測驗(APTITUDETESTS)又稱學能測驗、性向測驗、潛能測驗及稟賦測驗。其目的是了解學習目的語的潛力即所謂能力傾向如何,測驗編制者希望根據測驗的結果來預測學習者在未來學習目的語是否會成功。測驗的內容主要包括語音解碼編碼能力(模仿與聽辨)綜合歸納能力(猜詞猜句)語言記憶能力(速記)語言表達能力(口齒伶俐)如小語種學生選拔、高級口譯人才選拔,121幾種不同用途的測驗,診斷性測驗(DIAGNOSTICTESTS)本質上和成績測驗相同學什么考什么,但其測驗目的是為了了解學習者對教學內容哪些已經掌握了,哪些尚未掌握,以便調整教學。是非正式的測驗,完全由任課教師根據本班的具體情況來命題和施測,因此十分靈活,一般情況下也沒有必要實施標準化處理,而且對信度和效度也沒有太高的要求。,121幾種不同用途的測驗,安置性測驗(PLACEMENTTESTS)又稱分班測驗或分級測驗。其作用是評估學習者現有的語言水平高低,從而確定其適合于學習什么樣的課程或適合于在何種程度的班級上課。安置性測驗從效度角度考慮,最好是以教學單位的教學大綱或可能開設的課程內容為依據。,121幾種不同用途的測驗,小結,語言測驗可以劃分出上述五種主要的形式,但不意味著它們相互之間沒有聯系水平測驗可以用來評估學習者綜合運用目的語的能力,同時也可以用來安置學習者安置性測驗。成績測驗可以用來評價學習者在過去一段時間里所取得的學業(yè)成就,同時也可以用來診斷教學過程中的問題診斷性測驗。,122主觀性測驗和客觀性測驗,主觀性測驗其正確答案不止一個,且往往不是實施測試前能夠確定的,需要評分過程中自己作出主觀的判斷,對于同樣的考生答案,不同的評分員很可能會有不同的評判。如作文和口試。優(yōu)點考查有深度和層次,被試發(fā)揮水平余地大。命題容易。答案不唯一,增強測驗對考生能力的區(qū)分。缺點評分標準不詳盡周到,結果很難完全一致。閱卷評分費時費力,工作量大。,客觀性測驗事先規(guī)定了答題方式、答題范圍和標準答案,在評分過程中不需要評分員主觀判斷對錯的測驗就是客觀性測驗。如選擇題、是非判斷題等。優(yōu)點題量大,內容覆蓋面廣。評分簡單客觀??蓾M足統(tǒng)計學上的一些要求。缺點不太適合測試產出性語言技能和被試綜合運用語言的能力。某些題目,特別是多項選擇題,不完全是考生真實水平的體現。(可猜),123分立式測驗和綜合式測驗,分立式測驗是建立在結構主義語言學理論基礎上的一種測驗,它把語言分解成語音、語法、詞匯等不同的語言要素或語言點來測。測驗中的一個項目只測試被試對某一個具體的語言知識或語言要素是否掌握。往往采用多項選擇題、是非判斷題等題型,評分客觀、準確、可靠。如HSK初中等“語法結構”、“閱讀理解”中“詞匯”,123分立式測驗和綜合式測驗,綜合式測驗是全面考查被試運用語言的能力,了解被試能否把所掌握的語言知識或要素綜合起來并加以運用。有多種形式寫作、口試、完形填空等。由于很多綜合式測驗采用主觀性題目,故存在評分不一致、不可靠的問題。,124標準化測驗和非標準化測驗,標準化測驗特指采用客觀性試題的標有信度、效度、難度、區(qū)分度等各種測量學指標的、建立了常模的、在統(tǒng)一的環(huán)境和條件下施測、由專業(yè)機構或專業(yè)人士開發(fā)或參與、指導開發(fā)的測驗。四個環(huán)節(jié)試題編制的標準化測驗實施的標準化閱卷評分的標準化分數轉化與解釋的標準化,P295,小結,語言測試的發(fā)展階段與基本類型11語言測試的發(fā)展階段12語言測試的基本類別主觀性測驗和客觀性測驗分立式測驗和綜合式測驗標準化測驗和非標準化測驗,333應用性根據對外漢語教學的學科任務,決定了這一門理論與實踐緊密結合、具有極強實踐性的應用學科。作為教學活動的對外漢語教學必須理論與實踐相結合。一線教師積累有豐富的教學經驗,可以補充豐富教學理論;新加入的高學歷教師則需要教學法的學習,在教學中理論指導實踐。本學科研究方法的特點要進行科學實驗,獲得數據,進行定量、定性分析,從而得出客觀的、有說服力的結論。,33對外漢語教學的學科特點,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 24
大?。?0.95(MB)
子文件數:
-
簡介:語言的性別、年齡變異,語言的性別變異語言的年齡變異,語言的性別變異,含義分類絕對性別差異相對性別差異表現1)語言結構差異語音形式差異詞匯選擇差別語法規(guī)則運用差異2)言語行為差異3)語言能力差異A、含義B、一般情形C、相反情形產生差異的原因,語言性別差異含義,語言的性別變異是指男女在使用同一種語言或方言時表現出來的差別。,絕對性別差異相對性別差異,1)絕對性別差異主要指常見于原始部落文化群體中的一種特殊語言禁忌現象,表現為“男性語言”或“女性語言”。絕對性別差異是社會語言學、人類學和民族學等共同關注的現象。2)相對性別差異指男女使用同一種語言或方言時表現出來的使用特點差異,往往形成各種性別變體。相對性別差異是社會語言學關注的焦點問題。,語音形式差異,20世紀20年代的“女國音”現象就是把J、Q、C發(fā)成Z、C、S如堅JIAN念成ZIAN;學XUE念成SUE,詞匯選擇差別,封建社會,男性自稱“吾”、“我”;女性自稱“妾”、“奴”、“奴家”。現代社會,男青年口語中流行“好、棒”含義的蓋、蓋帽兒、絕、鎮(zhèn)、沒治;“不好、糟糕”含義的怯、臭、賴。男性使用頻率比女性高的詞語大款、大腕兒、大牌兒、款爺、倒爺。,語法規(guī)則運用差異,句型選擇上,美國男女使用被動語態(tài)時選擇“BE”和“GET”的頻率不一樣男性使用GET的頻率高于女性。,言語行為差異,男性較少發(fā)出邀請,一旦發(fā)出,往往比較具體,包含具體的時間、地點、活動內容等,而女性發(fā)出的邀請一般不具體,更多情況下是表達良好的意愿,而不是某種承諾。,語言能力差異含義,語言能力差異包括學習語言的能力和使用語言的能力差異;也包括母語能力和第二語言能力差異。,語言能力差異一般情形,一般認為,女性的語言能力比男性強,如高校外語專業(yè)女生普遍多于男生;社會上從事外語工作的女性多于男性。,語言能力差異相反情形,和一般認識相反的情形有A、貴州荔波縣瑤山鎮(zhèn)瑤族成年人會漢語的,男性占80%,女性只有5%;B、云南寧蒗縣永寧鎮(zhèn)納西族摩梭人,女青年都使用本族語言,而男青年在一起交談時習慣使用漢語。,語言性別差異產生的原因,1)社會地位的差別封建時代,女性社會地位低下,因而產生女性的賤稱。2)社會文化的影響“男主內,女主外”的社會里,男女說話涉及主題不同男人談論政治、體育以及生意經的多;女人談論社交生活、吃什么喝什么,家里有什么麻煩的多。3)社會價值取向的制約據調查,男女交談中,男性說得多,占用時間長,而且往往控制話題。,語言的年齡變異,含義表現1)語言結構差異A語音方面B詞匯方面C語法方面2)語言選擇差異產生差異的原因,語言的年齡變異含義,語言的年齡變異指不同年齡段的語言使用者在學習和使用語言時表現出來的差別。,語音方面,比如,韶關本城話按年齡不同分為老派、新派老派話聲母18個,區(qū)分N和L;韻母47個新派話聲母17個,不分N和L;韻母52個,少了4個入聲韻,詞匯方面,青少年學生常用詞語酷、爽、帥哥、靚妹、帥呆了、哇塞;“鐵托”、“托派”、“九三學社”,等等。,語法方面,ITGOTEATENBYTHECHILDREN年青人用GET的被動式比年長者多。青少年使用“GET”結構的頻率為25%。成年人為15%。,語言選擇差異,在一個社區(qū)交際中選擇什么語言,不同年齡、不同輩分的人存在差異。比如,湖南省保靖縣仙仁鄉(xiāng)一些三代同堂家庭老年人使用土家語;中年人跟父輩說土家語,跟小孩說漢語;15歲以下兒童主要使用漢語,會說土家語的極少。,語言年齡差異產生的原因,1)社會發(fā)展因素的影響2)語言系統(tǒng)演變因素的影響拉波夫對馬島央化元音演變的分析,雖是共時性的,但也涉及復雜的歷時性演變。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 19
大?。?0.15(MB)
子文件數:
-
簡介:長城漢語1GREATWALLCHINESE1,海岸角大學孔院曾衛(wèi)軍2016103,說明,教學對象零起點初學者教學內容長城漢語生存交際1第一單元第三課,補充了漢語拼音教學。教學目標融合漢字、詞匯、日常會話與拼音教學,基本掌握聲母和韻母的發(fā)音,能認讀漢字,能運用這些字詞進行簡單的會話交流。教學重點難點“你和您”的使用方法;JQX的發(fā)音;IANüEüANüN的發(fā)音。教學設想從一開始就加強漢字的認讀訓練,嘗試解決非漢字文化圈學習者漢字認寫難的問題。讓學生明白拼音僅僅是學習漢語的工具,把學習重點放在漢字詞的學習上。,第三課他是誰,第一單元你好,我是麥克,一、復習(REVIEW),1會話復習“你好你好”“你叫什么名字我叫____。你呢我叫______”“你是哪國人我是_加納人__,你呢我也是加納人。”(情景對話)2卡片認讀聲母BPMFDTNLGKH3卡片認讀韻母AIEIAOOUANENANGENGONG,一、生詞WORDS,NǐNíN你YOUSINGLE您(YOUPOLITEWǒTāTā我I,ME他HE,HIM她SHE,HER,,NǐMENWǒMEN你們YOU,PLURAL我們WE,USTā/TāMENSHì他/她們THEY,THEM是BE,AM,IS,ARERèNSHíɡāOXìNɡ認識(KNOW)高興GLAD,HAPPY,,SHUíLǎOSHī誰WHO老師TEACHERXUéSHENɡHěN學生STUDENT很VERYHǎOYě好GOOD,FINE,WELL也TOO,ALSO,生詞練習,(1)聽中文說英文和聽英文說中文Nǐ/NíNWǒTāTāNǐMENWǒMEN你/您我他她你們我們Tā/TāMENSHìRèNSHíɡāOXìNɡ他/她們是認識高興SHUíLǎOSHīXUéSHENɡHěN誰老師學生很HǎOYě好也,生詞練習,(2)認讀漢字詞。(師指讀;三名學生分別說英文、中文和指認)你/您我他她你們我們他/她們是認識高興誰老師學生很好也,二、會話(CONVERSATIONINTRODUCEYOURSELFANDOTHERPEOPLE,1介紹你自己(INTRODUCEYOURSELF)NǐHǎOWǒSHì_______A你好我是_______Nǐ/NíNHǎOWǒSHì_______。B你/您好我是_______。RèNSHíNǐHěNɡāOXìNɡA認識你很高興RèNSHíNǐWǒYěHěNɡāOXìNɡB認識你我也很高興,,會話1練習老師與學生做口頭會話練習,學生使用敬稱“您”。學生與學生做此口頭會話練習,可使用“你”。,,2介紹他人(INTRODUCEOTHERPEOPLE)NǐHǎO,KēFēINǐHǎO,LíNDáA你好,科菲B你好,林達Tā/TāSHìSHUíTā/TāSHìZēNɡLǎOSHīA他/她是誰B他/她是曾老師。CéNɡLǎOSHī,NíNHǎOWǒSHìLíNDá。A曾老師,您好我是林達。NǐHǎOLíNDá。C你好林達。RèNSHíNíN/NǐHěNɡāOXìNɡA認識您/你很高興RèNSHíNǐ/NíNWǒYěHěNɡāOXìNɡC認識你/您我也很高興,,會話2練習老師與兩名學生做此口頭會話練習,學生使用敬稱“您”。三名學生做此口頭會話練習,使用“你”。,三、拼音PINYIN,IAIEIAOIOUIANINIANGINGüüEüANüNIONGJJIAJIEJIAOJIUJIANJINJIANGJINGJUJUEJUANJUNJIONGQQIAQIEQIAOQIUQIANQINQIANGQINGQUQUEQUANQUNQIONGXXIAXIEXIAOXIUXIANXINXIANGXINGXUXUEXUANXUNXIONG,教學重點與難點,(1)JQX的教學中加對比QT?‘KYIT??I,TWIT??IMA’AKYEMEMAWOAKYE早上好。TWI,加納AKAN方言的一種。中英對比JT?QT?‘X?的發(fā)音要與英語D?、T?、?的發(fā)音區(qū)別開來,另外要避免發(fā)成尖音T?S、T?‘S、?S。,,(2)IAN、üE、üAN、üN的發(fā)音IANIΕN注意不要發(fā)成開口度較大的IANIANüEYΕ注意ü的發(fā)音。üANYАN注意ü的發(fā)音。üNYN注意ü的發(fā)音。,PīNXIěɡUīZé拼寫規(guī)則(SPELLRULES),1JQX與ü及帶ü韻母相拼省略兩點JüJUQüQUXüXUJüEJUEQüEQUEXüEXUEJüANJUANGQüANQUANXüANXUANJüNJUNQüNQUNXüNXUN2IOU寫成IUJIOUJIUDIOUDIUNIOUNIU,拼音練習,1指出聽到的音節(jié);JIAQIAJIONGQIONGKANQUAN()QINQUNHAOXIAOXUEXIE,,2聽音填聲母____IE____IAN____ING_____IA_____Ué____IàO3聽音寫韻母B____P_____D_____J_____Q_____X_____,四、鞏固小結,(一)師口頭小結所學內容。(二)鞏固練習1連線(MATCHTHEPINYINANDCHARACTERSNíN我Nǐ也Wǒ您Tā你Tā好TāMEN是RèNSHí很NǐMEN高興SHUí老師XUéSHENɡ你們HěN誰SHì學生HǎO他Yě她LǎOSHī認識ɡāOXìNɡ他們,2CHOOSETHERIGHTWORDSTOFILLINTHEBLANKS,_________好我是瑪麗。(她你)_________是科菲。(她他)老師,_________好(您你)他是_________(好誰)你們好我______林達。(是好),3.COMPLETETHEFOLLOWINGDIALOGUE,(1)A你是_________B我是科菲。(2)A_________是誰B他是曾老師。(3)A你們好我________曾老師。B您好(4)A我________林達,他______科菲。B你們好(5)A______________________B她是林達。,4標寫聲調MARKTHETONES,JIQILINGDANGMIANBAOQIANMIANQIFENXIAWUJIUJINGJIANBINGPINQIONG5聽寫音節(jié)(DICTATETHESYLLABLES),五、作業(yè),1與家人及朋友進行對話練習;2記憶所學單詞;3練習讀拼音。,
下載積分: 6 賞幣
上傳時間:2024-01-07
頁數: 24
大?。?0.2(MB)
子文件數:
-
簡介:語言學大戰(zhàn),模糊語法、格語法擴展了的標準理論與經過修正的擴展了的標準理論,語言學大戰(zhàn)的序幕,JOHNROSS和他的貢獻生成語義學(語義表達式)模糊語法語言學大戰(zhàn),,VVVVVVVCAUSEBECOMENOTALIVE使變得不活KILL殺死,,,,,,,,,,,格語法,CHARLESFILLMOREAPROPOSALCONCERNINGENGLISHPREPOSITIONS1966THECASEFORCASE1968TOWARDAMODERNTHEORYFORCASE1969類別信息與題元信息非常深的深層結構格的排序,,SMODEPROPOSITIONPERFVOIA開KNPKNPKNP0N用N0N門鑰匙周華,,,,,,,,,,,,,,,,,,,,,,,,格的排序,A主事(AGENTB經事(EXPERIENCERC工具(INSTRUMENTD受事(OBJECTE來源(SOURCEF對象(GOALG處所(LOCATIONH時間(TIME,擴展了的標準理論,關于動詞名物化的一些看法(1970)深層結構,表層結構及語義說明(1971)轉換的必要條件(1973),擴展了的標準理論的主要精神,新的短語結構式新的句法流程轉換的盲目性和獨立性以及廣義限制規(guī)則新的小句結構式虛跡的概念,新的短語結構式,AS?NVBX?SPEC,XXCX?XY,新的句法流程,,,短語搭配規(guī)則詞匯插入規(guī)則轉換規(guī)則音系規(guī)則,語義表達式,,,,,,,,語義說明規(guī)則,,,深層結構,,表層結構,詞庫,語音表達式,廣義限制規(guī)則,時態(tài)句條件。在XΑY這樣的結構中,如果Α是一個有時態(tài)的小句,那么任何規(guī)則都不可以同時與X及Y發(fā)生關系。近鄰原則轉換規(guī)則的運用應該限制在一個周期性節(jié)點的統(tǒng)轄范圍之內,或者是在兩個緊挨著的周期性節(jié)點的統(tǒng)轄范圍之內。,新的小句結構式,S’COMPS,,,虛跡,這件事情I我早就聽TI周華說過TI了。,,,,,,,經過修正的擴展了的標準理論,語法規(guī)則的必要條件(1976)論WH移動(1977)過濾器及控制(CHOMSKYANDLASNIK1977,經過修正的擴展了的標準理論之主要精神,移動Α新的句法流程過濾器,,短語結構規(guī)則D結構移動ΑS結構邏輯形式語義表達式語義規(guī)則(1)語義規(guī)則(2)語音規(guī)則語音表達式,,,,,,,過濾器,ASTHATSNPTBWHOIDOYOUTHINKTHATTISAWBILLNPNPTENSEVPAΑNPTOVP,UNLESSΑNPORFOLLOWSVORPBITISUNCLEARWHATJOHNTODOCABOOKTOREADDTOFORCEHIMTOLEAVECOMPWHPHRASEΦ,Φ≠E,,A連發(fā)現他I的警察都立了二等功的那個持槍搶劫犯IB連發(fā)現TI的警察都立了二等功的那個持槍搶劫犯I,,NPS’NPCOMPS那個小偷K(那個小偷KNP立了二等功S’NPCOMPS警察I(警察)ITI抓住TK(的),,,,,,,,,,,,,,,,,,,,,,,請畫出下面短語的簡單樹形圖,熱衷戲劇的人都喜歡的那種蘋果腐爛的原因,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 21
大?。?0.04(MB)
子文件數:
-
簡介:論國家語言資源,國家語言資源監(jiān)測與研究中心平面媒體分中心北京語言大學應用語言學研究所張普,報告內容,國家語言資源監(jiān)測與研究中心論資源論國家資源論語言資源論國家語言資源,國家語言資源監(jiān)測與研究中心,2004年6月底,鑒于新世紀語言文字發(fā)展和應用的需求,經教育部語言文字應用管理司具體運作,教育部與北京語言大學共建了一個機構“國家語言資源監(jiān)測與研究中心(平面媒體)”。,國家語言資源監(jiān)測與研究中心,國家語言資源監(jiān)測與研究中心(平面媒體分中心)國家語言資源監(jiān)測與研究中心(有聲媒體分中心)國家語言資源監(jiān)測與研究中心(網絡媒體分中心)國家語言資源監(jiān)測與研究中心(教育教材分中心)海外華語媒體語言資源監(jiān)測與研究中心,,,DCC,國家語言資源檢測研究中心平面媒體分中心,語信司,語言大學,中宣部,信息產業(yè)部,教育部,廣電部,國務院新聞辦,新聞出版署,中心領導,研究所,培訓,,,,,,,,,,,,國家語言資源檢測研究中心有聲媒體分中心,,傳媒大學,,,,,,中國語言生活狀況報告(2005),置疑,語言是資源語言是國家資源,報告內容,國家語言資源監(jiān)測與研究中心論資源論國家資源論語言資源論國家語言資源,論資源,辭海“資財的來源。一般指天然的財源?!爆F代漢語詞典修訂本“生產資料或生活資料的天然來源地下~│水利~│?旅游~?!彪S著人類社會的發(fā)展與科學技術的進步,資源的內涵與外延不斷深化與擴大,使用頻度在不斷提高。?,F在不僅自然的物質的財富(例如國土、礦產、森林、水)是資源,而且人力是資源,信息也是資源。甚至連“關系”、“人脈”、“身體”都被認為是資源,可開發(fā)、利用。,資源科學,關于資源的研究已經形成一門科學,就叫“資源科學”。中國自然資源叢書(42卷本)開始編纂,1995年陸續(xù)出版。中國資源科學百科全書2000年。卷首的論文資源科學指出“資源科學是研究資源的形成、演化、質量特征與時空分布及其與人類社會發(fā)展之相互關系的科學?!?資源科學的分類,資源科學一文給出“資源科學”最上位的分類是“綜合資源學”、“部門自然資源學”和“社會資源(學)”。兩點認識其一,2000年,資源科學領域就已經對“社會資源”有十分明確的認識和權威論述。其二,2000年,資源科學領域認為“社會資源(學)”相對后起,學科還不夠系統(tǒng)、深入、全面、成熟,“(學)”還帶著括號,“社會資源學”作為學科還不能完全獨立。中國資源科學百科全書近1000頁,屬于社會資源部分的篇幅僅有區(qū)區(qū)25頁。,報告內容,國家語言資源監(jiān)測與研究中心論資源論國家資源論語言資源論國家語言資源,論國家資源,國家資源,國家自然資源,國家人文資源,,不可再生資源,礦山,海洋,國土,可再生資源,森林,水,氧氣,,,,,,,,,,,,,,原生態(tài)資源,非原生態(tài)資源,人口,,,,民族,語言,,人力,教育,衛(wèi)生,文化,信息,,,,,,,,論國家資源,資源的所有制資源的開發(fā)與利用資源的普查、監(jiān)測與立法,國力象征,管理水平生態(tài)環(huán)境,執(zhí)政能力,和諧基礎,依法管理,國家自然資源,是指“人類可以利用的、自然生成的物質與能量。它是人類生存的物質基礎?!比绲V產資源、土地資源、海洋資源、水資源、森林資源。自然資源已經受到國際和國內的高度重視,進行了深入的研究,納入了依法管理的軌道。我國土地資源、水資源、礦產資源、能源、氣候資源、生物資源、海洋資源等都有相關的法律法規(guī)。自然資源可以從各種角度進行分類。按照能否再生可以分為不可再生資源與可再生資源。按資源的蘊藏之處又可分為“陸地自然資源”、“海洋自然資源”和“太空自然資源”。,國家社會資源,現代漢語詞典“生產資料或生活資料的天然來源”,舉例卻是“地下│水利?旅游?!毕柴R拉雅山、長白山、天山五臺山、武當山、峨眉山是旅游資源,則除了天然的部分似乎又多了宗教的成分長城、故宮、天壇、兵馬俑作為旅游資源則更強調歷史文化的成分新疆、云南、西藏是旅游資源大省,除了自然資源、歷史文化資源外,更加強調的還有民族、民俗的資源。至于絲綢之路、雕塑蠟染、石窟巖畫、南方水鄉(xiāng)、北方大院,甚至特色旅游、農家旅游、紅色旅游等等,這些人文的、社會的旅游資源,似乎就不是“天然來源”所能概括的了。,國家社會資源,從“貝”的“資”和“財”,雖然本來與上古時代作為錢幣的天然動物“貝”有關,但是作為貨幣,就已經是人類社會的、經濟的產物,籌“資”與計“財”更與天然無關了。,國家社會資源,資源RESOURCES“‘資財之源’,或者說資源是創(chuàng)造人類社會財富的源泉。馬克思認為創(chuàng)造社會財富的源泉是自然資源和勞動力資源?!薄百Y源按其屬性分為自然資源和社會資源兩類。自然資源是指自然界存在的對人類有用的自然物,例如土地、水流、森林、礦產、野生動植物等。社會資源包括范圍相當廣,在當前的技術經濟條件下,主要是指構成社會生產力要素的勞動力資源,利用自然資源加工創(chuàng)造的生產資料以及直接為生產服務的商業(yè)、運輸、信息、通信、科技、管理等非實物形態(tài)的資源或勞務?!敝袊Y源科學百科全書,社會資源(學),社會資源(學)的分支學科是“研究社會資源的分類、屬性、質量評價與時空特征及其與自然資源開發(fā)利用的相互關系的學科。它是資源科學與社會科學之間一門交叉性學科。主要研究內容包括人力資源(學)、資本資源(學)、科技資源(學)與教育資源(學)?!?社會資源(學)的發(fā)展,“資源是一個可變的歷史范疇”?!白鳛橘Y源主體的自然資源和勞動力資源的種類、形態(tài)、結構和功能依各個歷史時期的社會生產力水平和科學技術水平的變化而變化?!薄白匀毁Y源向實物資源演變”、“從生活資料性的資源擴展到生產資料性的資源”、“從實物性的資源擴展到非實物性的資源”、“勞動力資源的消耗從體力勞動逐漸向智力勞動演變”等。這種變化已經越來越顯著、越來越受到社會和學術界的關注。社會資源和社會資源學正在迅猛發(fā)展,語言資源正是社會資源中極其重要的一部分。,社會資源(學)的發(fā)展,首都資源優(yōu)勢卻是市場資源配制、金融資源、科技資源、教育資源、學習資源、文化資源、旅游資源、人才資源等,這些資源就是資源科學領域所指的社會資源。綱要不僅突出強調了北京的社會資源,還突出了“支持城市優(yōu)質教育資源向農村輻射”、“加快優(yōu)質衛(wèi)生資源向農村轉移”等對社會資源的政策性指導,更加彰顯了對社會資源的重視。今天社會資源的合理配置、監(jiān)管、公平、市場化都已經是和自然資源一樣重要或者是更加重要的研究課題。,社會資源(學)的發(fā)展,文化部已經在2006年1月底從31個省市和相關部門推薦的1315個項目中審議篩選了501項作為第一批國家非物質文化遺產名錄向社會公示。據統(tǒng)計,到2004年7月,全球有世界遺產788項,其中文化遺產611項,自然遺產153項,雙遺產23項,自然遺產的比例不到20%。,社會資源(學)的發(fā)展,中國教育資源網、中國法律資源網、中國旅游資源網、中國考試資源網、中國環(huán)境資源網、中國產品資源網、中國電子資源網、中國科幻資源網、中國創(chuàng)新資源網、中國管理資源網等等。不以中國打頭的更有國家基礎教育資源網、中小學語文教育資源網、中學語文中考、高考資源網、中小學教學課件資源網、中學生物教學資源網、衛(wèi)生教育資源網、德育資源網、運動資源網、武術資源網、影視資源網等等。,報告內容,國家語言資源監(jiān)測與研究中心論資源論國家資源論語言資源論國家語言資源,論語言資源,國家語言資源中心的成立,其任務就是要把語言作為資源(特別是作為“國家語言資源”)來進行監(jiān)測和檢測,就是要推進社會資源學下的“語言資源(學)”的建立與發(fā)展。,論語言資源,1、語言資源是社會資源的重要組成部分語言是社會的產物,是人類社會最重要的交際工具,是構成社會的人的最重要的社會屬性,語言資源當然是人類社會的社會資源的重要組成部分。無論是廣義的還是狹義的解釋,社會資源都必須包括語言資源。,論語言資源,2、語言資源是最基礎的社會資源,是負載非物質形態(tài)社會資源的資源。會創(chuàng)造并使用語言和記錄語言的文字符號系統(tǒng),是人與其他動物的最重要的區(qū)別。語言能力是人的最基本的能力,語言文字是人類進入社會以來從人口資源、人力資源走向人才資源的最重要的依據,因為其他一切非物質形態(tài)的“科學技術、教育、信息、管理、文化”等社會資源,離開了語言和文字就無從談起,語言和文字是社會資源中最重要、最基礎的資源,是負載其他智力資源的資源??傊?,是語言資源支撐著人力資源走向智力資源、人才資源,然后我們才能創(chuàng)造知識經濟、創(chuàng)新經濟、網絡經濟、數字經濟、綠色經濟,才能進入信息社會和知識社會以求生存。,論語言資源,3、語言資源是信息社會最重要的信息資源信息資源是信息社會國家重要的戰(zhàn)略資源。數字化信息資源的擁有量、利用率、處理水平、更新速度、安全程度等都是衡量一個國家進入信息社會的發(fā)展水平的重要指標。語言資源既是國家物質資源信息也是非物質資源信息的載體,所以語言資源也是國家進入信息社會的最重要的信息資源。語言資源的利用、管理、研究成為提高國家語言信息處理水平的關鍵,國家對于信息社會的語言資源,必須及時地有效地進行監(jiān)測與研究。有關語言資源和語言資源評估的國際研討會(2004)也已經舉行?!皣H中文語言資源聯盟”2006年1月14日召開的最新的年會在清華大學舉行,應引起傳統(tǒng)語言學界的重視。,論語言資源,4、漢語和漢字也是人類非物質文化遺產,構成物質的和非物質文化資源。語言資源涉及語言學和文字學,也涉及民族學、人類學、哲學、宗教、文化藝術、認知科學等。漢語、漢字可以說是人類的一筆豐富的非物質文化遺產。包括漢語各種地區(qū)方言、社會方言,都是漢語史的活化石,隨著全球化趨勢的加強和現代大眾傳媒與現代信息科技產業(yè)的迅猛發(fā)展,語言資源正在迅速地發(fā)生變異。語言隨著一代人或幾代人的更迭發(fā)生異化、受損以至消亡都是可能的,也是不可避免的。中國乃至全世界的文化生態(tài)正在發(fā)生變化,一些無形文化遺產正在消失和破壞,其中許多遺產也是不可再生的。目前文化部公示的501項非物質文化遺產中,從春節(jié)、清明節(jié)、端午節(jié)、七夕節(jié)、中秋節(jié),到中和韶樂、納西古樂、蘇繡、云錦、全聚德、唐三彩,哪一項離得了語言文字的解釋與說明更不要說語言文字本來就是遺產的組成部分的評彈、昆曲、皮影戲、川江號子等等。就連江永女書都已經列入非物質文化遺產,世界上使用人口最多、歷史最悠久的語言與文字漢語、漢字,當然應該是重要的非物質文化遺產、非物質文化資源。,語言資源的分類,語言資源類語言的本體資源。中國的語言收錄迄今發(fā)現的中國的語言130種左右。言語資源類語言的社會應用資源?!皣艺Z言資源監(jiān)測與研究中心”監(jiān)測的語言資源。語言學習資源類一類是自然語言學習資源,一類是非自然語言(或稱人工語言)的學習資源。自然語言學習資源又分為兩類,一類是母語的學習資源,任何一個民族都需要有自己本民族語言的學習資源,就我國而言,非漢族的少數民族和漢族的方言地區(qū)的人民群眾還需要有通用語言文字的學習資源。另一類是外語的學習資源,或者稱為第二語言學習資源。,報告內容,國家語言資源監(jiān)測與研究中心論資源論國家資源論語言資源論國家語言資源,論國家語言資源,我們必須把語言資源納入國家資源的體系,才能受到各方重視,才能受到法律的保護,我們也才有依據依法處置。2003年,我在關于漢語語料庫的建設與發(fā)展問題的思考一文中寫到,論國家語言資源,“我們認為所謂‘國家語料庫’的建設、開發(fā)、保護應該是一種國家行為,在信息社會和數字化生存時代,我們要把語言資料的收集、保護、開發(fā)提高到一種對待國家資源的高度來認識。國家要像對待人力資源、地礦資源、國土資源、森林資源、水資源一樣對待語言資源,語言資源是國家最重要的信息資源。語料庫的建設、保護、開發(fā)要站在國家面向未來的一種戰(zhàn)略決策高度,要作為一種對待國家資源的行為,才能得到法律的保護,納入法制的軌道?!?論國家語言資源,“當前,愈來愈多的人已經認識到了環(huán)境保護、物種保護、水土保護、文物保護等的重要性和迫切性,社會宣傳的力度、采取的保護措施和投入的人力物力都比較大。但是非常遺憾的是,卻很少有人意識到語言保護的重要性和迫切性?!保钣蠲?論國家語言資源,我們認為語言文字的標準化和規(guī)范化有三方面的服務作用,一是服務于國民的語文教育,二是服務于語言文字的社會應用,三是服務于國家的信息化建設。我們將服務于國家的信息化建設單獨列出來,主要是要突出這種社會服務的特殊性和重要性。為此,國家對于信息社會的語言文字應用必須及時進行監(jiān)測與研究。目前我們所說的需要進行監(jiān)測與研究的國家語言資源,特指在國家大眾傳媒上公開流通傳播的中國的語言文字所構成的言語應用資源,以及九年義務制教育的語文教材及其他基礎教育學科教材所使用的語言文字資源。這樣的文字都有知識產權,都受到中華人民共和國著作權法的保護,所以,國家必須依法對國家語言資源進行監(jiān)測、管理和研究。不包括經國務院相關部門批準的在國家大眾傳媒上公開流通傳播的外國語言文字;也不包括在一些公共場所的廣播和用字;一些社會上的招牌、廣告用語用字(大眾傳媒上出現的除外);商品的包裝、說明上的用語用字;更不包括個人所使用的不在大眾傳媒上流通傳播的語言、文字。,論國家語言資源,國家語言資源,就包括出現在中國境內的下述大眾傳播媒體上的語言文字中國境內出版、發(fā)行、發(fā)布的平面媒體(報紙、雜志、圖書等)的文稿以及相關通訊社的電訊稿;中國境內出版、運行的有聲媒體(廣播、電影、電視、錄音帶、錄象帶、光盤、電子圖書)的文稿、錄音與圖像;中國境內注冊運作的網絡媒體(包含次級界面,不包含跨網站鏈接,不包含傳統(tǒng)媒體的上網部分)上的文稿、錄音與圖像;中國境內電信媒體支持服務的手機短信、彩信、短新聞等。,論國家語言資源,我們還認為國家少數民族語言文字大眾傳媒上的語言資源;港澳特別行政區(qū)和臺灣地區(qū)的大眾傳媒上的語言資源;盲文、手語等特殊語言文字作為載體的大眾傳媒的語言資源;某些特殊媒體上的語言資源。中華人民共和國境外漢字、漢語大眾傳媒和華文、華語大眾傳媒上的語言資源。,論國家語言資源,目前在世界59個主要國家的資源績效水平的排序中,中國尚排在倒數第6位,如果就社會資源的開發(fā)、利用和績效進行排序,位置恐怕更不堪設想。這些無不鞭策我們要加速研究、開發(fā)、利用“社會資源”。就語言學領域而言,就是要加快“語言資源學”的研究,迅速推進對“國家語言資源”的開發(fā)、利用和管理,讓語言資源真正作為社會的基礎資源服務于國家在新形勢下的建設和發(fā)展的需要。,,謝謝,關于國家語言資源的監(jiān)測,監(jiān)測什么監(jiān)測什么在變化和怎樣變化(動態(tài))監(jiān)測什么不變化和怎樣的不變化(穩(wěn)態(tài))當前階段主要監(jiān)測字、詞、語的使用及字、詞、語之間的關系怎樣監(jiān)測監(jiān)測大眾傳媒對語言文字的使用監(jiān)測教材對語言文字的使用監(jiān)測大眾傳媒和教材對口語的影響監(jiān)測的深化要從靜態(tài)向動態(tài)深化要從頻度向使用度、實用度和流通度深化要從單純監(jiān)測字、詞、語深化到監(jiān)測三者之間的關系,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 40
大?。?0.61(MB)
子文件數:
-
簡介:1,網絡編程語言,2,應用程序程序編程接口(套接字),實現網絡應用時,要從由網絡輸出的接口開始。既然大多數網絡協議都是由軟件實現的(特別是協議棧中的高層協議),而且?guī)缀跛械挠嬎銠C系統(tǒng)都將網絡協議的實現作為操作系統(tǒng)的一部分,因而我們說“由網絡輸出的”接口時,通常指的是操作系統(tǒng)為它的網絡子系統(tǒng)提供的接口。這個接口叫做網絡的應用程序編程接口(API)。雖然每個操作系統(tǒng)都可以自由地定義自己的API,但隨著時間的推移,有些API已獲得了廣泛的支持;也就是說,除了它們原始的系統(tǒng)外,它們還被移植到操作系統(tǒng)中。,3,應用程序程序編程接口(套接字),套接字接(SOCKETINTERFACE)口它最初是由加州大學伯克利分校的UNIX小組開發(fā),而現在幾乎所有流行的操作系統(tǒng)都支持它。業(yè)界支持單一API的優(yōu)點是使得應用程序可以很簡單地從一個操作系統(tǒng)移植到另一個操作系統(tǒng)。但是我們得記住一點,通常應用程序與操作系統(tǒng)許多部分相互作用,而不僅僅與網絡相互作用。例如,讀寫文件,產生并行進程和輸出圖形顯示。每個協議提供了一系列服務(SERVICE),API則提供了特定操作系統(tǒng)中調用這些服務所用的語法(SYNTAX)。然后,實現的作用是把API定義的具體操作和對象映射到協議定義的抽象服務集上。,4,應用程序程序編程接口(套接字),套接字接口的主要概念是套接字(SOCKET)。理解套接字的好方法是把它看作本地應用進程與網絡的接入點。接口定義了各種操作,包括創(chuàng)建套接字、將套接字連到網上、通過套接字發(fā)送/接收消息,關閉套接字。為了簡化討論,我們在此只討論TCP中如何使用套接字。第一步是創(chuàng)建套接字,用如下操作實現該操作有三個參數是因為套接字接口被設計成通用的,定義支持任意的底層協議集。,,5,應用程序程序編程接口(套接字),,2TYPE參數表明通信的語義。SOCK_STREAM說明是字節(jié)流。SOCK_DGRAM則表明是面向消息的服務,像UDP提供的一樣。,,3PROTOCOL參數則指明將要用到的特定協議。,,SOCKET返回值是新創(chuàng)建套接字的句柄(HANDLE),即以后引用該套接字時使用的標識符。在套接字的其他操作中,它也將作為一個參數。,,1DOMAIN參數描述將使用的協議族。AF_INET用于表示因特網協議族。AF_UNIX用于表示UNIX管道功能,6,客戶/服務器模式,在TCP/IP網絡應用中,通信的兩個進程間相互作用的主要模式是客戶/服務器模式(CLIENT/SERVERMODEL),即客戶向服務器發(fā)出服務請求,服務器接收到請求后,提供相應的服務。客戶/服務器模式的建立基于以下兩點首先,建立網絡的起因是網絡中軟硬件資源、運算能力和信息不均等,需要共享,從而造就擁有眾多資源的主機提供服務,資源較少的客戶請求服務這一非對等作用。其次,網間進程通信完全是異步的,相互通信的進程間既不存在父子關系,又不共享內存緩沖區(qū),因此需要一種機制為希望通信的進程間建立聯系,為二者的數據交換提供同步,這就是基于客戶/服務器模式的TCP/IP。,,7,客戶/服務器模式,客戶/服務器模式在操作過程中采取的是主動請求方式首先服務器方要先啟動,并根據請求提供相應服務1打開一通信通道并告知本地主機,它愿意在某一公認地址上(周知口,如FTP為21)接收客戶請求;2等待客戶請求到達該端口;3接收到重復服務請求,處理該請求并發(fā)送應答信號。接收到并發(fā)服務請求,要激活一新進程來處理這個客戶請求(如UNIX系統(tǒng)中用FORK、EXEC)。新進程處理此客戶請求,并不需要對其它請求作出應答。服務完成后,關閉此新進程與客戶的通信鏈路,并終止。4返回第二步,等待另一客戶請求。5關閉服務器,8,客戶/服務器模式,客戶方1打開一通信通道,并連接到服務器所在主機的特定端口;2向服務器發(fā)服務請求報文,等待并接收應答;繼續(xù)提出請求3請求結束后關閉通信通道并終止。從上面所描述過程可知1客戶與服務器進程的作用是非對稱的,因此編碼不同。2服務進程一般是先于客戶請求而啟動的。只要系統(tǒng)運行,該服務進程一直存在,直到正?;驈娖冉K止。,9,應用程序程序編程接口(套接字),下一步看你是客戶還是服務器。如果是服務器在服務器主機上,應用進程執(zhí)行一個被動的打開,即服務器表明它已準備好接受連接,但并沒有真正建立連接。服務器通過調用以下三個操作來完成打開,10,套接字類型,TCP/IP的SOCKET提供下列三種類型套接字。(1)流式套接字(SOCK_STREAM)提供了一個面向連接、可靠的數據傳輸服務,數據無差錯、無重復地發(fā)送,且按發(fā)送順序接收。內設流量控制,避免數據流超限;數據被看作是字節(jié)流,無長度限制。文件傳送協議(FTP)即使用流式套接字。(2)數據報式套接字(SOCK_DGRAM)提供了一個無連接服務。數據包以獨立包形式被發(fā)送,不提供無錯保證,數據可能丟失或重復,并且接收順序混亂。網絡文件系統(tǒng)(NFS)使用數據報式套接字。(3)原始式套接字(SOCK_RAW)該接口允許對較低層協議,如IP、ICMP直接訪問。常用于檢驗新的協議實現或訪問現有服務中配置的新設備。,11,典型套接字調用過程舉例,如前所述,TCP/IP協議的應用一般采用客戶/服務器模式,因此在實際應用中,必須有客戶和服務器兩個進程,并且首先啟動服務器,其系統(tǒng)調用時序圖如下。面向連接的協議(如TCP)的套接字系統(tǒng)調用如下圖所示服務器必須首先啟動,直到它執(zhí)行完ACCEPT調用,進入等待狀態(tài)后,方能接收客戶請求。假如客戶在此前啟動,則CONNECT將返回出錯代碼,連接不成功。,見下圖,12,服務器方客戶方,13,STATUSOFPARENTANDCHILDPROCESSESWITHRESPECTTOTHESOCKET,,,,,,,,14,典型套接字調用過程舉例,無連接協議的套接字調用如下圖所示無連接服務器也必須先啟動,否則客戶請求傳不到服務進程。無連接客戶不調用CONNECT。因此在數據發(fā)送之前,客戶與服務器之間尚未建立完全相關,但各自通過SOCKET和BIND建立了半相關。發(fā)送數據時,發(fā)送方除指定本地套接字號外,還需指定接收方套接字號,從而在數據收發(fā)過程中動態(tài)地建立了全相關。,見下圖,15,,16,應用程序程序編程接口(套接字),1BIND操作如其名字一樣,是將新創(chuàng)建的SOCKET與ADDRESS綁定。這是本地參與者(即服務器)的網絡地址。注意,ADDRESS在因特網協議中使用時是表示一個數據結構,其中包括服務器的IP地址和TCP端口號。端口號通常是一些眾所周知的、專門提供給服務的號嗎;例如,WEB服務器通常在端口80上接受連接。,2LISTEN操作定義在指定的SOCKET上可以有多少個待處理的連接。,3ACCEPT操作完成被動打開。它是一個阻塞的操作,在遠程參與者沒有建立起連接前,它不會返回任何參數,一旦連接成功,它將返回一個表示這個新建連接的新的套接字,并且ADDRESS參數還包括了遠程參與者的地址。,注意,當ACCEPT返回時,以前作為參數給定的原始套接字依然存在并依然對應于被動打開;在以后調用ACCEPT時它仍作為參數。,17,應用程序程序編程接口(套接字),在客戶機上,應用程序執(zhí)行主動打開;也就是,它通過調用如下的一個操作來表明它希望與誰通信,該操作直至TCP成功建立連接后才返回,此時應用程序就可以開始發(fā)送數據。ADDRESS中包括了遠程參與者的地址。實際上,客戶機通常只描述遠程參與者的地址,讓系統(tǒng)自動填寫本地信息。鑒于服務器通常在共知的端口監(jiān)聽消息,一般地,客戶機并不關心它自己用哪個端口;操作系統(tǒng)簡單地選一個未用端口即可。,18,應用程序程序編程接口(套接字),一旦連接建立,應用進程將調用以下兩個操作來發(fā)送和接收數據,這個操作在指定的SOCKET上發(fā)送MESSAGE,這個操作則是將從指定的SOCKET上收到的消息放入指定的BUFFER。它們都使用一系列FLAGS來控制操作的特定細節(jié)。,19,應用實例,現在,我們來看一個簡單的客戶機/服務器程序的實現,它用套接字接口在一個TCP連接上發(fā)送消息。這個程序還用到了其他的UNIX網絡功能,我們將逐個介紹。我們的應用允許用戶在一端的機器上輸入并把文本發(fā)送給另一端機器的用戶。它是UNIX中TALK程序的一個簡化版本,類似于WEB聊天室的核心程序。,20,應用實例,1客戶端我們先從客戶端開始,它用遠端的機器名作為參數。它調用UNIX程序GETHOSTBYNAME把該名字翻譯為遠端主機的IP地址。下一步是構造套接字接口所需的地址數據結構(SIN)。注意這個數據結構表明我們將一直用套接字與因特網連接(AF_INET)。在以下例子中,我們用TCP端口號5432作為共知的服務器端口號;它恰好不是分配給其他因特網服務的端口號。建立連接的最后一步是調用SOCKET和CONNECT。一旦CONNECT操作返回,建立起連接,客戶機程序將進入主循環(huán),不斷從標準輸入讀取文本并通過套接字發(fā)送。,21,客戶端程序,22,應用實例,2服務器服務器的實現也很簡單。首先,它填入自己的端口號(SERVER_PORT)構造地址數據結構。其次,它并不指明IP地址,從而使應用程序可以接受來自本地任一IP地址的連接。然后,服務器執(zhí)行與被動打開有關的初始步驟創(chuàng)建一個套接字,將它綁定到本地地址。然后設置允許同時連接的最大數。最后,主循環(huán)等待遠端主機與它連接,當遠端有一臺主機試圖與它連接時,它就接收并輸出連接上送來的字符。,23,服務器程序,24,協議實現的問題,應用程序與底層網絡交互的方式類似于高層協議與低層協議交互的方式。例如,TCP需要一個接口向IP發(fā)送消息,同時也需要IP能向TCP傳送消息。這就是服務接口。既然我們已經有了網絡的API(如套接字),或許我們可以在協議棧的每一對協議間使用同樣的接口。盡管這只是一種選擇,但在實際中我們并不這樣使用套接字接口。原因在于套接字接口在協議實現方面的低效是協議實現者所不能忍受的。應用編程人員之所以能忍受是因為它簡化了編程工作,而且畢竟他對低效只需忍受一次就夠了,而協議實現者卻要常常被它們的性能所困擾,總擔心穿過幾層協議是否能得到一條消息。本節(jié)的其余部分將討論網絡API和位于協議圖下方的協議到協議接口的兩點主要不同。同時介紹協議實現常用到的庫例程。,25,協議實現的問題,1進程模型大多數操作系統(tǒng)都提供一種抽象概念叫進程(PROCESS),或叫線程(THREAD)。每個進程的運行很大程度上獨立于其他進程,操作系統(tǒng)負責確保給所有當前的進程分配如地址空間和CPU周期這樣的資源。進程這一抽象概念使得在一臺機器上并發(fā)運行多個事件變得相當簡單;例如,每個用戶的應用程序可以在自己的進程中執(zhí)行,操作系統(tǒng)中的各種事件可以作為其他進程執(zhí)行。操作系統(tǒng)將正在CPU上運行的進程停止并啟動另一進程時,我們稱這一轉換為上下文切換(CONTEXTSWITCH)。,26,協議實現的問題,在設計一個網絡子系統(tǒng)時,首先要回答的問題之一是,“進程在哪兒”基本上有兩種選擇,如圖所示。第一種選擇,我們稱為進程/協議(PROCESSPERPROTOCOL)模型,每個協議由一個獨立的進程實現。這就意味著當一條消息向協議棧的上方或下方移動時,它被從一個進程/協議傳送到另一個進程/協議,即實現協議I的進程處理這個消息,然后把它傳給協議I1,以此類推。一個進程/協議如何向下一個進程/協議傳遞消息依賴于主機操作系統(tǒng)提供的進程間通信的支持。通常有一個簡單的機制把消息與進程排隊。然而,重要的一點是,協議圖的每一層都要求上下文切換,這是一個典型的耗時操作。,27,協議實現的問題,我們把另一種稱為進程/消息(PROCESSPERMESSAGE)模型,它把每個協議當做一段靜態(tài)編碼并把進程同消息聯系起來。也就是說,當網絡送來一條消息時,操作系統(tǒng)調度一個進程,使之負責消息在協議圖中向上移動。在每一層,調用實現該協議的過程,然后調用實現下一個協議的過程,以此類推。對于輸出的消息,應用程序調用必要的過程,直到消息被送入網絡。在兩個方向中,協議圖都被一系列過程調用一遍。,28,協議實現的問題,結論雖然有時感覺進程/協議模型比較容易,即我在我的進程中實現我的協議,而你在你的進程中實現你的協議。但由于一個簡單的原因,進程/消息模型通常更有效即在大多數計算機上,過程調用的效率比上下文切換高一個數量級。第一種模型要求每一層有一個上下文切換,而第二種模型只要求每一層有一個進程調用。,29,協議實現的問題,大多數協議實現用DELIVER操作代替RECEIVE操作。也就是低層協議做向上調用(UPCALL),它是一個向上調用協議棧的過程,將消息傳送到高層協議。圖顯示了兩個相鄰協議(本例中為TCP和IP)的接口。一般情況下,消息向協議棧的下方移動調用一系列SEND操作,向協議圖上方移動則調用一系列DELIVER操作。,代碼段用下列操作,其中LLP表示低層協議,其上的正在調用它的協議已被配置;HLP表示正在調用協議之上配置的高層協議。注意,我們用PROTOCOL這一變量類型和變量LLP和HLP簡化了使用,它們隱藏了協議圖中如何配置協議、高層協議如何在低層協議上打開一個連接的細節(jié)。,30,協議實現的問題,2消息緩沖區(qū)套接字接口的第二個低效之處在于當調用SEND時應用進程提供緩沖區(qū),保存向外發(fā)送的消息,類似于當調用RECEIVE時將進來的消息復制到緩沖區(qū)中。它強制最高層的協議把消息從應用程序緩沖區(qū)復制到網絡緩沖區(qū)中,或反之,如圖所示。將數據從一個緩沖區(qū)復制到另一個緩沖區(qū)是協議實現中代價最高的工作之一。因為處理器的速度以巨大的步伐加快,而內存的發(fā)展并不如處理器那么快。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 30
大?。?0.69(MB)
子文件數:
-
簡介:統(tǒng)計自然語言處理基本概念,模型,,,,,真實世界中的系統(tǒng),模型1,INPUT,,,OUTPUT,,模型2,,OUTPUT1,OUTPUT2,如果OUTPUT1總是和OUPUT接近,OUTPUT2總是和OUTPUT偏離,我們就認為模型1比模型2好,,,,,,,真實系統(tǒng),,,,模型1,,模型2,INPUT,OUTPUT,,模型由體系結構和參數兩部分構成舉例住宅樓多層板樓高層板樓高層塔樓參數層數戶型三室一廳,兩室一廳,舉架高度供熱方式地熱暖氣片,目錄,樣本空間SAMPLESPACE估計器ESTIMATOR和隨機過程STOCHASTICPROCESS信息論INFORMATIONTHEORY數據集分類DATASETCLASSIFICATION性能評價PERFORMANCEMEASURE,樣本空間SAMPLESPACE,,試驗EXPERIMENT,試驗一個可觀察結果的人工或自然的過程,其產生的結果可能不止一個,且不能事先確定會產生什么結果例如連擲兩次硬幣樣本空間是一個試驗的全部可能出現的結果的集合舉例連擲兩次硬幣?{HH,HT,TH,TT},H面朝上T面朝下,事件EVENT,事件一個試驗的一些可能結果的集合,是樣本空間的一個子集舉例連擲兩次硬幣A至少一次面朝上B第二次面朝下A{HT,TH,HH},B{HT,TT},事件的概率,事件的概率重復M試驗,如果事件A出現的次數為N,則事件A的概率為PAN/M,這稱為概率的頻率解釋,或稱統(tǒng)計解釋頻率的穩(wěn)定性又稱為經驗大數定理舉例連擲兩次硬幣A至少一次面朝上B第二次面朝下PA3/4,PB1/2當試驗不能重復時,概率失去其頻率解釋的含義,此時概率還有其他解釋貝葉斯學派和信念學派一個人出生時的體重,一個人只能出生一次,舉例,舉例連續(xù)三次擲硬幣樣本空間?{HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}事件A恰好兩次面朝下A{HTT,THT,TTH}做1000次試驗,計數得386次為兩次面朝下估計PA386/10000386繼續(xù)做7組試驗,得373,399,382,355,372,406,359,共8組試驗計算平均值PA03860373/80379,或累計PA386373/80003032/80000379統(tǒng)一的分布假設為3/80375,概率空間,概率空間的三個公理PA?0P?1PA?BPAPBIFA?B?這三條公理也是概率的原始定義推論P?0A?B?PA0正相關,?0X和Y關聯強度大IX,Y0X和Y無關IX,Y0X和Y具有互補的分布,熵ENTROPY,熵ENTROPYCHAOS(混沌),無序物理學除非施加能量,否則熵不會降低舉例把房間弄亂很容易,整理干凈不容易是不確定性UNCERTAINTY的衡量不確定性越高,熵越高,我們從一次實驗中得到的信息量越大,熵的公式,熵HX?X??PXLOGXPX假設PXX是隨機變量X的分布基本輸出字母表是?單位BITS熵是X的平均信息量,是自信息量的期望EX?X??PXXIXLOGPX,取2為底,IXLOG2PXEIXELOG2PX?X??PXLOG2PXHXHXHPHPXHXPHPX,熵的例子,擲均勻硬幣,?{H,T}PH5,PT5HP05LOG20505LOG205132面的均勻骰子,擲骰子HP321/32LOG21/325事實上,212,2532PERPLEXITY擲不均勻硬幣PH02,PT08,HP0722PH001,PT099,HP0081,好書店,差書店,,什么時候HP0試驗結果事先已經知道即?X??,PX1?Y??,PY0IFY?X熵有沒有上限沒有一般的上限對于|?|N,HP?LOG2N均衡分布的熵是最大的,,等概率分布2個輸出的等概率分布,HP1BIT32個輸出的等概率分布,HP5BITS43億輸出的等概率分布,HP32BITS非等概率分布32個輸出,2個05,其余為0,HP1BIT怎樣比較具有不同數量輸出的“熵”,混亂度PERPLEXITY,混亂度GP2HP平均每次試驗有多少種可能的結果在NLP中,如果詞表中的詞具有統(tǒng)一的分布概率,則最難預測,熵最大,混亂度最高反之,分布越不均衡,熵越小,混亂度越小,聯合熵和條件熵,兩個隨機變量X空間是?,Y?聯合熵JOINTENTROPYX,Y被視為一個事件HX,Y?X???Y??PX,YLOG2PX,Y條件熵CONDITIONALENTROPYHY|X?X???Y??PX,YLOG2PY|XPX,Y是加權,權值是沒有條件的,條件熵,HY|X?X??PXHY|XX?X??PX?Y??PY|XLOG2PY|X?X???Y??PY|XPXLOG2PY|X?X???Y??PX,YLOG2PY|X,熵的性質,熵的非負的HX?0CHAINRULEHX,YHY|XHXHX,YHX|YHYHX,Y?HXHY,X和Y獨立時相等HY|X?HY,條件熵比熵小,熵的編碼意義,如果一個符號序列是滿足概率分布P的隨機過程產生的,那么對這個序列進行編碼至少需要的BIT數是HP壓縮問題如果數據中有很多重復的模式,則易于壓縮,因為熵小否則,熵大,不容易壓縮,編碼實例,怎樣給ISOLATIN1編碼通常用8位經驗表明有的字符經常出現,有的字符很少出現我們可以給經常出現的字用較少的BIT來表示,給很少出現的字符用較多的BIT來表示假設P‘A’03,P‘B’03,P‘C’03,其余PX00004編碼A00,B01,C10,其余11B1B2B8對于符號串ACBBéCBAAC,編碼為ACBBéCBAAC0010010111000011111001000010如果每個符號用8位編碼,需要80位,現在需要28位,語言的熵,PCN1|C1CNCI是語言中的一個字符C1CN是歷史H舉例漢語,N3P趙|圍魏救高P去|我曾經低計算語言的條件熵?H?H?C??PC,HLOG2PC|H,各種語言的熵,按字母計算的零階熵法文398BITS意大利文400BITS西班牙文401BITS英文403BITS德文410BITS俄問435BITS中文(按漢字計算)965BITS中文(按筆畫計算)343BITS按詞匯計算的零階熵英語100BITS漢語1146BITS說明漢語的詞匯豐富語言的冗余度英語73;俄語70;漢語63;古文更低,KULLBACKLEIBLER距離,假設通過一組試驗估計得到的概率分布為P,樣本空間?,隨機變量X真實的分布為Q,相同的?和X現在的問題是P和Q相比,誤差多大KULLBACKLEIBLER距離給出的答案是DQ||P?X??QXLOG2QX/PXEPLOGQX/PX,KL距離(相對熵),習慣上0LOG00PLOGP/0?DISTANCEORDIVERGENCE(分歧)不對稱DQ||P?DP||Q也不滿足三角不等式事實上,DQ||P不是距離,而是分歧HQDQ||P根據Q分布,對P進行編碼需要的BIT數(交叉熵),平均互信息,隨機變量XYPX?YX,YPXXPYY兩個離散集之間的平均互信息IX,YDPX,Y||PXPY?X???Y??PX,YLOG2PX,Y/PXPY這里說的是兩個離散集的平均互信息互信息衡量已知Y的分布時,對X的預測有多大的幫助,或者說Y的知識降低了HX或者說PX,Y和PXPY之間的距離,,互信息的性質,IX,YHXHX|YHYHY|XIX,YHXHYHX,Y因為HX,YHX|YHYIX,XHX因為HX,X0IX,YIY,XIX,Y?0,交叉熵CROSSENTROPY,典型情況我們得到一個觀察序列T{T1,T2,TN},TI??估計?Y??PYCY/|T|,定義CY|{T?T,TY}|但是,真實的Q不知道,再大的數據也不夠問題用P對Q進行估計是否準確方法用一個不同的觀察序列T’估計實際的Q,交叉熵,HP’PHP’DP’||PHP’P?X??P’XLOG2PXP’當然也不是真實的分布,但是我們視為真實世界的分布,以便測試P交叉混亂度GP’P2HP’P,條件交叉熵,實踐中計算的往往是條件交叉熵兩個樣本空間樣本空間?,隨機變量Y,Y?Y上下文樣本空間?,隨機變量X,X?X實驗得到的分布PY|X,“真實”分布P’Y|XHP’P?Y??,X??P’Y,XLOG2PY|X條件交叉熵中的權值是P’Y,X,不是P’Y|X,,在實際應用中,在全部兩個樣本空間上做累加通常不是很方便,因此常常簡化使用如下公式HP’P?Y??,X??P’Y,XLOG2PY|X1/|T’|?I1|T’|LOG2PYI|XI事實上,就是在T’上進行累加,然后歸一化1/|T’|LOG2?I1|T’|PYI|XI,舉例,?{A,B,,Z},概率分布(估計值)PA025,PB05,P?1/64,??{C,,R},P?0,??{S,,Z}測試數據為BARB,P’AP’R025,P’B05在?上做累加?ABCDQRSZP’?LOG2P?0505000150025也可以在測試數據上進行累加,然后歸一化SIBARBLOG2PSI1261101/4?1025,,HP和HP’P之間可能有各種關系包括‘?’,‘?’,‘?’舉例(參照上例)HP25測試數據BARBHP’P1/4126125測試數據PROBABLEHP’P1/866612166425測試數據ABBAHP’P1/4211215,交叉熵的使用,不是比較數據,而是比較分布如果我們有兩個分布P和Q,哪一個更好呢面對“真實數據”S,P和Q誰的交叉熵低,誰就更好HTP1/|S|LOG2?I1|S’|PYI|XIHTQ1/|S|LOG2?I1|S’|QYI|XI,,數據集分類,,,訓練集TRAININGSET用來獲得模型參數測試集TESTINGSET從訓練集以外獨立采樣反映系統(tǒng)面對真實世界的處理能力測試集經常被無意識地“做了手腳”交叉確認集CROSSVALIDATIONSET從訓練集和測試集以外獨立采樣主要用來幫助做設計決策,測試集,測試集從訓練集去評價系統(tǒng)的性能,結果往往過于樂觀如果模型的參數比需要的多很多時,獲得100的準確率也是可能的過擬和OVERFITTING常常出現在訓練數據的數量不足以支持模型的復雜程度之時為此,我們需要另一個數據集來模擬用戶的真實需要,,在設計階段,不允許偷看測試數據的細節(jié),以保證測試數據不被污染你不能參照測試數據來決定模型的復雜度,特征空間的維數,以及什么時候決定停止訓練過程等設計決策可以參照交叉確認數據進行每一個階段采用一個不同測試集當你試圖選擇一個最好的方法使測試效果達到最佳時,實際上已經在無意識地使你的系統(tǒng)偏向測試集問題的關鍵在于測試集并不是真實數據本身,如果面向測試集調整參數,可能造成系統(tǒng)對于從未見過的真實數據效果下降,,交叉確認集如果在訓練集合上獲得了比較差的結果,我們必須重新設計如果在訓練集合上獲得了比較好的結果,那可能是因為模型確實好(在測試數據上性能一樣會好)模型過擬和(在測試數據上性能會下降)由于不允許使用測試集來改進系統(tǒng)設計,因此需要另一個數據集,性能評價,,,使用有限的樣本進行性能測試有估計誤差性能評價的結果和測試數據的大小有關不同數據集的測試結果往往不同性能上限PERFORMANCEUPPERBOUND人與人取得一致的指標就是系統(tǒng)性能的上限,,聯立表CONTINGENCYTABLE,,準確率PPRECISIONN11/N11N21召回率RRECALLN11/N11N12錯誤率EERRORRATEN12N21/N11N12N21N22FMEASURE2PR/PR,謝謝,,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 72
大?。?0.47(MB)
子文件數:
-
簡介:經管學院2014年語言文字工作總結,總結,2014年,我院結合本院實際情況,努力提高師生語言文字意識,提升學院文化品位,增強學院凝聚力、向心力。學院領導十分重視語言文字工作,帶頭參加各項語言文字規(guī)范化活動,并派專人成立語言文字工作小組,定期召開語言文字工作會,定期檢查全院師生語言文字工作情況,及時轉達學校普通話測試工作及語言文字工作的相關安排,設立了相關獎罰制度,實行年底考核評優(yōu)。學院多次開展語言文字規(guī)范化活動,如學生讀書報告會、“打造絕佳策劃案”培訓講座、“寄語春天”教職工詩歌朗誦會、“人際交往和溝通技巧”專題講座、年青年教師教學基本功比賽、我的中國夢奮斗的青春最美麗主題辯論賽等一系列形式生動活潑、意義深遠的語言文字活動。9月,學院還推出普通話宣傳周特別活動,以海報、標語、橫幅、墻報等豐富多樣的形式推廣普通話。學院建有普通話網頁,通過網頁傳播語言文字知識、展示語言文字規(guī)范化活動開展情況。學院組織師生向重慶大學語言文字工作網投稿。此外,學院師生積極參加學校和機關組織的各類語言文字規(guī)范化活動。,目錄,三、語言文字宣傳工作,一、領導重視機構健全,二、積極開展語言文字教育培訓、競賽或趣味活動,四、積極參加全國、重慶市、學校或機關組織的語言文字類競賽活動,五、日常工作用語用字規(guī)范情況,點擊添加文本,一、領導重視機構健全,經管學院建立了學院領導牽頭的語言文字工作領導小組,定期召開專題會議,對語言文字工作進行布置和檢查,安排專人按時報送要求提交的相關信息和數據等。,廖冰副院長主持語言文字工作會,廖冰副院長、辦公室副主任葉平檢查普通話與文字使用規(guī)范情況,,,二、積極開展語言文字教育培訓、競賽或趣味活動,學生讀書報告會,“打造絕佳策劃案”培訓講座,“寄語春天”教職工詩歌朗誦會,“人際交往和溝通技巧”專題講座,二、積極開展語言文字教育培訓、競賽或趣味活動,我的中國夢奮斗的青春最美麗主題辯論賽,師生語言文字規(guī)范知識測試,行政教職工“金秋十月愛我中華”詩歌朗誦活動,普通話推廣情況調研活動,二、積極開展語言文字教育培訓、競賽或趣味活動,經管學院舉辦2014年青年教師教學基本功比賽在比賽中,選手們各展所長,展示了青年教師的激情和風貌。授課內容充實、清晰,教具、模型使用恰當,講解深入淺出,多媒體課件制作精美,展示了不同的教學特色和授課風格。,“搞定高水平論文”講座,知識競賽之“傳統(tǒng)文化”活動,,,三、語言文字宣傳工作,1推普周宣傳活動,,,2.語言文字網頁專欄,學院建有專門的語言文字網頁,全方位及時反映我院全年開展的各類宣傳、教育、競賽、培訓等活動情況,HTTP//SEBACQUEDUCN/PTHYYWZGZ/INDEXJHTML,,,3.新聞投稿16篇,,,四、積極參加全國、重慶市、學?;驒C關組織的語言文字類競賽活動,袁絲語,能源經濟重慶大學第十四屆外語文化節(jié)系列活動之微電影三等獎戴燕珊ACCA班軍訓朗誦比賽三等獎陳偉會計1班重慶市首屆科普人員及科普志愿者培訓結業(yè)證書林巧、韋超、信管軍訓期間紅色主題朗誦比賽三等獎,五、日常工作用語用字規(guī)范情況,要求師生教職員工講普通話要求師生教職員工規(guī)范使用語言文字在醒目處張貼語言文字宣傳海報、宣傳欄及時傳達學校相關語言文字工作文件通知學院領導定期檢查語言文字工作的開展情況,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數: 12
大?。?4.08(MB)
子文件數:
-
下載積分: 5 賞幣
上傳時間:2024-03-06
頁數: 4
大?。?0.47(MB)
子文件數:
-
下載積分: 6 賞幣
上傳時間:2024-03-05
頁數: 21
大?。?0.26(MB)
子文件數:
-
下載積分: 6 賞幣
上傳時間:2024-03-05
頁數: 12
大?。?0.06(MB)
子文件數:
-
下載積分: 6 賞幣
上傳時間:2024-03-06
頁數: 7
大?。?0.05(MB)
子文件數:
-
下載積分: 3 賞幣
上傳時間:2024-03-05
頁數: 2
大?。?0.03(MB)
子文件數: