1 1 CH1_ 第一章 資料與統計 © 滄海書局. 2 2 CH1_ 第一章 資料與統計 n 商業與經濟上的應用 n 資料 n 資料來源 n 敘述統計 n 統計推論.

Slides:



Advertisements
Samankaltaiset esitykset
Japanilainen Uusi Vuosi
Advertisements

Kommunisti, sotilas ja poliitikko
Tokio 東京 とうきょう  © 芹田 ヴィルピ © VirpiSerita 2014.
Työryhmäohjelmointi IOO450. SMS (tekstiviesti) on lyhenne Short Message Service:sta. Se on GSM-normien perusteella standardi lyhyiden tekstiviestien (maks.
Kiinalaisen shakin esittelyluento
ISU-ARVIOINTI.
OULU ADVANCED RESEARCH ON SOFTWARE AND INFORMATION SYSTEMS Teppo Räisänen | Oulun yliopisto Facebook API Teppo Räisänen Tietojenkäsittelytieteiden.
Internet and HTML Heikki Hietala. Internet stats 7/2005 WORLD INTERNET USAGE AND POPULATION STATISTICS World Regions Population ( 2005 Est.) Population.
RUOKAPROVINSSI Food Province Province Alimentaire Matregion 食料産業先端地帯 Lebensmittelprovinz Продовольственная провинция.
Japanin matkaeväspaketti 3
おぼえていますか。 En puhu kiinaa ollenkaan. Saisinko kahvia.
Koirat…. vastaan ihmiset….
GA implementaatiot Oskar Norrback q vuotinen historia, ~130k LoC, TDD(96%) natural, best chromosomes, roulette wheel selection Crossover, averaging.
SEURANTAJÄRJESTELMÄ KOKKOLASSA  Jokaiselta ysiluokkalaiselta tiedonsiirtolupa > nimen saa siirtää seurantajärjestelmään (kesä)  Pohjatieto,
Kansainväliset opiskelijat – porstuassa vai kynnyksellä? Cimo, Trainet-verkosto Päivi Jyry.
VALOA Kansainväliset opiskelijat – porstuassa vai kynnyksellä? Cimo, Trainet-verkosto Päivi Jyry.
Wireless Sensor Networks: An Information Processing Approach Luku 2: Canonical Problem: Localization and Tracking 2.1 A Tracking Scenario 2.2 Problem Formulation.
Kiinankulttuurin esittely
HTML-lomakkeettMyn1 HTML-lomakkeet Web-sovelluksen käyttöliittymä rakentuu web-selaimen ominaisuuksista ja keskeisimmiltä osiltaan erityisesti HTML-kielellä.
Rinnakkaisuus Järjestelmässä, jossa voi olla useita prosesseja rinnakkain suorituksessa voi tulla tilanteita, joissa prosessien suoritusta täytyy kontrolloida.
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Simulation of deuterium.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 30 - Aatu Kaapro Optimointiopin seminaari - Syksy 2005 / 1 Dynaamiset Bayes-verkot Osa.
Lajihavainnot tietojärjestelmiin Lajihavainnot tietojärjestelmiin: keskusteluseminaari eliöhavaintojen keruusta Suomessa Viikki.
我 居住 的社區 屏東縣新園區社區. 新園 社區 我的家鄉 Muokkaa jäsennyksen tekstimuotoa napsauttamalla Toinen jäsennystaso Kolmas jäsennystaso Neljäs jäsennystaso Viides jäsennystaso.
Kurssin alustava ohjelma Luento (13.1.) kurssin tavoitteet oheismateriaali ohjelma peruskäsitteet typologian ensimmäinen määrittely.
DTD rakenne ELEMENT elementtien määrittely ATTLISTattribuuttien määrittely ENTITYentiteettien määrittely NOTATIONnotaatioiden määrittely.
Osoittimen määrittely ja alustus tMyn1 Osoittimen määrittely ja alustus Osoitin (pointer) on muuttuja, joka voi sisältää keskusmuistiosoitteen. Osoitinmuuttujan.
EVTEK Mobile Application Laboratory. EVTEK Espoo-Vantaa Institute of Technology.
VliSS-virtual laboratory in survey sampling Risto Lehtonen Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos TieVie-seminaari Jyväskylä.
Sisältötuotanto ActionScript Anssi Jääskeläinen VO: Tiistaisin 6606.
Avoimen tiedon ohjelman tavoitteet ja toiminnan kohteet keväälle 2015.
汉 字 Kiinan kirjoitusmerkit
Arvo – opetushallinnon vaikuttavuustietopalvelu ja AVOP-kysely
Harjoituksista.
EU Norm sähköiseen laskutukseen - CEN TC-434 Mahdolliset vaikutukset Suomalaiseen käytäntöön Tapani Turunen Tieto, Value Networks
Markkinoiden juridinen toimintaympäristö Luento 4
Datan avaamisen ohjeistus
Harri Lehtinen Dissemination of Statistical Data, Publications and Metadata - Process Based on Common Structure of Statistical.
Profiilirekisteri & Implementointioppaan läpikäynti
Isomeria jaetaan rakenne- ja stereoisomeriaan.
Ilmasotakoulu Tikkakoski
Kemialliset sidokset – vahvat ja heikot
Fly Further! Täydennyshaku saakka Katja Kurasto Kv-palvelut
Avoimen tiedon ohjelman tavoitteet ja toiminnan kohteet keväälle 2015
Kuka vastaa kyselyyn? - Kevät 2016
Avoimen tiedon julkaisuprosessi ja lisensointi
Datan avaamisen ohjeistus
Taloudellinen katsaus Kevät 2016
Ylivertaisella osaamisella maailmalle
Probability models and decision analysis
Probability models and decision analysis : introduction
How to handle uncertainty in future projections?
Probability models and decision analysis : introduction
DIC and BMA in BUGS Biotieteellinen tiedekunta / Henkilön nimi / Esityksen nimi
Probability models and decision analysis
Esityspaikka/tapahtuma pp.kk.vvvv
eCallin ja ERA-GLONASS:n yhteentoimivuuden varmistaminen
Château de Fabregues Grenache Syrah Rosé
Osallistu – Jäsenhankkijaryhmä Mikä on Jäsenhankkijaryhmän idea!
电 子邮件: 介绍 2016\12\07 大家好! 电 子邮件: 电话: 阿克.
平成  年  月  日 あて ご 住 所 お客様名 取 り 下 げ 届 先に申し込んだNTT東日本専用契約について、下記のとおり取り下げをしたいのでお届けします。 記 1.申込者名 2. 品 目 3. 開廃希望日  平成  年  月  日 4. 申込種類( 新 設 ・ 場 変 ・ 廃 止 ) 5. 使用区間 
緊急時一斉通報システムのご紹介 <netinfosシリーズ>
Copyright Pearson Prentice Hall
Deluxe Corporation Group 6 郭育丞、徐翌展、黃子豪 張暘全、林思妤.
Expression levels of HSP genes in the liver of Q
毎月レポート ビジネスの情報 (2019年7月号).
Which Test Should I Use?.
CBO Data Access Framework
Distribution of covariates in the original, unweighted sample of households in Nunavut before the launch of Nutrition North Canada, during implementation.
Unless otherwise stated, we will work over Z2 = {0, 1}
Esityksen transkriptio:

1 1 CH1_ 第一章 資料與統計 © 滄海書局

2 2 CH1_ 第一章 資料與統計 n 商業與經濟上的應用 n 資料 n 資料來源 n 敘述統計 n 統計推論

3 3 CH1_ 商業與經濟上的應用 n 會計 會計師事務所為客戶做帳目稽核時,會利用統計抽樣 程序。 n 財務 財務顧問利用各種統計資訊來作為投資建議的依據。 n 行銷 某些研究機構購買各零售點的銷售點掃瞄資料,經過 資料彙總處理之後,再出售計統計資料給製造商。

4 4 CH1_ n 生產 許多品質管制圖常被用來當作監控生產製程的產出。 n 經濟 經濟學家常要預測未來的經濟狀況或相關發展趨勢, 他們用很多統計資訊來做這方面的預測。 商業與經濟上的應用

5 5 CH1_ 資料 n 元素、變數及觀察值 n 衡量尺度 n 定性與定量資料 n 橫斷面及時間序列資料

6 6 CH1_ 資料與資料集合 n 資料 是指經由蒐集、分析、彙總而得的一群事實與數字 ,以作為說明與解釋之用。 n 為特定研究目的蒐集的資料可稱為資料集合 (data set) 。

7 7 CH1_ 元素、變數及觀察值 n 元素 (element) 指的是資料蒐集的主體 (entities) 。 n 變數 (variable) 代表某個我們有興趣的屬性。 n 對特定變數蒐集的一組衡量值,就稱為觀察值 (observation) 。 n 資料集合中的資料個數,就等於元素的數目乘上變數 的數目。

8 8 CH1_ 資料、資料集合、元素、變數及觀察值 觀察值 變數 元素 資料集合 變數

9 9 衡量尺度 n 衡量尺度包括: 名目尺度 名目尺度 順序尺度 順序尺度 區間尺度 區間尺度 比例尺度 比例尺度 n 衡量尺度決定資料包含的訊息。 n 尺度也告訴我們,那種資料分析及統計匯總的方式是 最適當的。

10 CH1_ 衡量尺度 n 名目尺度 資料是標籤或名字,用來表示元素的屬性。 資料是標籤或名字,用來表示元素的屬性。 數值或非數值的符號都可用做標籤。 數值或非數值的符號都可用做標籤。 例如,表 1.1 中的變數 ─ 股票交易場所 (EXCHANGE) 中的 NYSE, AMEX, OTC 用來表示股票交易的場所 ,就是種名目尺度。 例如,表 1.1 中的變數 ─ 股票交易場所 (EXCHANGE) 中的 NYSE, AMEX, OTC 用來表示股票交易的場所 ,就是種名目尺度。

11 CH1_ 衡量尺度 n 順序尺度 資料具備名目尺度的特性,而且資料的順序是有意 義的。 資料具備名目尺度的特性,而且資料的順序是有意 義的。 非數值或數值符號都可以是順序尺度的變數內容。 非數值或數值符號都可以是順序尺度的變數內容。 例如,回卷調查顧客對服務水準的評價,有「非常 好」、「好」、「不好」。或者是以「1」表示非 常好,以「2」表示好,等等。 例如,回卷調查顧客對服務水準的評價,有「非常 好」、「好」、「不好」。或者是以「1」表示非 常好,以「2」表示好,等等。

12 CH1_ 衡量尺度 n 區間尺度 具備順序尺度的資料特性,而且觀察值之間的間隔 可以用固定的衡量尺度來表示。 具備順序尺度的資料特性,而且觀察值之間的間隔 可以用固定的衡量尺度來表示。 區間尺度一定是數值資料。 區間尺度一定是數值資料。 例如, Melissa 的 SAT 是 1205 分, Kevin 是 Melissa 比 Kevin 多了 115 分。 例如, Melissa 的 SAT 是 1205 分, Kevin 是 Melissa 比 Kevin 多了 115 分。

13 CH1_ 衡量尺度 n 比例尺度 具備區間尺度的所有性質,而且兩個數值之間的比 例是有意義的。 具備區間尺度的所有性質,而且兩個數值之間的比 例是有意義的。 諸如距離、高度、重量及時間之類的變數都是比例 尺度。 諸如距離、高度、重量及時間之類的變數都是比例 尺度。 這種尺度包含零值,變數值為零時表示沒有任何東 西。 這種尺度包含零值,變數值為零時表示沒有任何東 西。 例如, a款車的成本是 $30000 , b 款車的成本則是 $15000 ,則 a 款車的成本是 b 款車的兩倍。 例如, a款車的成本是 $30000 , b 款車的成本則是 $15000 ,則 a 款車的成本是 b 款車的兩倍。

14 CH1_ 定性和定量資料 n 資料可進一步區分為定性及定量資料。 n 統計分析是否適用於某一特定變數,需視變數的資料 是定性或定量。 n 一般而言,定量資料可進行較多的統計分析。

15 CH1_ 定性資料 n 定性資料 是指一組可以用來確認一個元素屬性的標記 或名稱。 n 定性資料可以用名目尺度或順序尺度來衡量。 n 定性資料可以是數值型態,也可以是非數值型態。 n 對定性資料可進行的統計分析很有限。

16 CH1_ 定量資料 n 定量資料 是指可數或不可數的各種數值。 n 定量資料一定是數值型態。 n 定量資料的基本數學運算是有意義的。

17 CH1_ 橫斷面和時間序列資料 n 橫斷面資料 在同時間或幾乎同時間蒐集的資料。 例如: 2000 年 8 月份,各縣市政府發出的建築許可 的數目。 例如: 2000 年 8 月份,各縣市政府發出的建築許可 的數目。 n 時間序列資料是在數個時間間隔內蒐集的資料。 例如:過去 36 個月,台南縣政府每個月發出的建築 許可的數目。 例如:過去 36 個月,台南縣政府每個月發出的建築 許可的數目。

18 CH1_ 資料來源 n 現存資料 某些情況下,某種特定應用所需要的資料已存在一 個公司或組織中. 例如,有關顧客、供應商及員工 的詳細資料通常都保存在公司中。 某些情況下,某種特定應用所需要的資料已存在一 個公司或組織中. 例如,有關顧客、供應商及員工 的詳細資料通常都保存在公司中。 我們可以從某些專門從事蒐集與整理資料的組織獲 得有關商業與經濟的重要資料。 我們可以從某些專門從事蒐集與整理資料的組織獲 得有關商業與經濟的重要資料。 政府機關也是現存資料的重要來源。 政府機關也是現存資料的重要來源。 資料也可從各種產業組織和特別機構取得。 資料也可從各種產業組織和特別機構取得。 網際網路 網際網路 網際網路已成為資料的重要來源。 網際網路已成為資料的重要來源。 許多政府單位,如行政院主計處等,將許多資料 置於網站上供人閱讀。 許多政府單位,如行政院主計處等,將許多資料 置於網站上供人閱讀。 愈來愈多的企業擁有自己的網站。 愈來愈多的企業擁有自己的網站。

19 CH1_ n 統計研究 統計研究可分為實驗性研究與觀察性研究兩種。 統計研究可分為實驗性研究與觀察性研究兩種。 實驗性研究首先要定義我們感興趣的變數,接著確 定並控制實驗過程中的因素,以便獲得這些因素如 何影響變數的資料。 實驗性研究首先要定義我們感興趣的變數,接著確 定並控制實驗過程中的因素,以便獲得這些因素如 何影響變數的資料。 在非實驗性或觀察性研究中,不對感興趣的變數加 以控制或影響。 在非實驗性或觀察性研究中,不對感興趣的變數加 以控制或影響。 調查,可能是最常見的觀察性研究。 調查,可能是最常見的觀察性研究。 資料來源

20 CH1_ 資料取得的考慮事項 n 時間 取得資訊可能很花時間。 取得資訊可能很花時間。 取得資訊時,資訊已過時。 取得資訊時,資訊已過時。 n 成本 取得資訊要花成本。 取得資訊要花成本。 n 資料錯誤 因為取得方便就使用該資料,可能會取得錯誤或品 質不佳的資料。 因為取得方便就使用該資料,可能會取得錯誤或品 質不佳的資料。

21 CH1_ 敘述統計 n 以表格、圖形或數字來彙總資料,這種方式稱為敘述 統計。

22 CH1_ 範例: 25 家公司股票的交易場所的次數與百分比

23 CH1_ 範例: 25 家公司股票的交易場所的次數與百分比

24 CH1_ 統計推論 n 利用樣本 (sample) 得來的資料對母體 (population) 特性 做估計與假設檢定,這種程序稱為統計推論 (statistical inference) 。

25 CH1_ 範例: Norris 電子公司 Norris 公司為評估新的燈絲的優點,抽取 200 個新燈絲加以測試 ,並蒐集 200 個燈泡壽命的資料。 200 個燈泡的平均壽命是 76 小 時。

26 CH1_ 範例: Norris 電子公司 n 統計推論的程序