luentosuunnitelma_2017.txt

-*- coding:utf-8 ; mode:org -*-

Käyttöjärjestelmät, kevät 2017.

Tämä on suunnitelma, joka muuttuu ajankäytön ja muun
perusteella. Pohjana luentojen eteneminen viime vuonna, jolloin
kokonaisuus oli jo aika perushyvä.


* Luentojen toteuma 2017:

** Luento 1: Aloitus, yleisinfo ja suoritusvaatimukset

Luennon päätavoite on kuvailla kurssin tekniset vaatimukset ja muu
perusinfo. Varsinaiseen asiaankin ehdittiin alustavalla tasolla
viimeisen vartin ajan.

- Esittelyt: opettajat, opiskelijat, opiskelijoiden pääaineet
  (Millainen jakauma 2017? viime vuonna oli suurin osa
  tietotekniikalta, noin puolet tästä määrästä
  tietojenkäsittelytieteeltä, lisäksi fyysikalta, matematiikalta sekä
  englannin ja suomen kielen opiskelijoita. Opiskelijoiden
  pääasialliset käyttöjärjestelmät omassa käytössä (pöytäkoneet,
  tabletit, älypuhelimet)?

- Perinteinen ryhmäkuva vuosia harjoitellulla
  koreografialla... Kaikki, mitä "koreografiassa" nähdään, liittyy
  yksityiskohtiin, joiden parissa kurssilla pyöritään alusta loppuun,
  muiden asioiden muassa.

- Käydään läpi, mistä kaikki kurssiin liittyvä löytyy (kaikkiin löytyy
  linkki kurssin nettisivulta):

  * Luentomoniste

  * Osaamistavoitteet

  * Demot ja niiden palautusjärjestelmä (HUOM: käytetään tänäkin
    vuonna vuoden 2015 tehtäviä - muutoksia ei juurikaan tarvittu
    esim. viime vuonna; päivitetään ministi jotain jossain vaiheessa,
    mikäli tarvetta ilmenee). 

    Seuraavalla luennolla tulee opastus ensimmäisiin demoihin, joten
    sinne asti voi olla ihan hyvä vielä malttaa ja käyttää aikaa
    vaikkapa esitietojen kertaamiseen, erityisesti Ohjelmointi 1:n
    osalta.

    Palautusjärjestelmää ei myöskään ole vielä ehditty testata tälle
    vuodelle, joten teknisestikään tänään ei ole vielä hyvä päivä
    palauttaa.

    Demojen miettiminen ryhmässä on aina suotavaa, mutta jokaisen
    tulee palauttaa tiedosto omalla tunnuksellaan jo teknisistä
    syistä. [Lisäksi jokainen vastatkoon omalta kohdaltaan siitä, että
    aivan itselle kertyy käytännön osaamista, vaikka frendi jeesaa! On
    se myös frendin vastuulla!]

  * Tomin "palopuhe" demojen tekemisestä. Olennaisimmat kohdat
    aiemmilta vuosilta (tarkennetaan tarvittaessa 2017):

      + Ohjeet on syytä lukea ja ymmärtää ennen palautuksen tekemistä.

      + Vastausten ei tarvitse olla täydellisiä - tarkistus on harkinnan
        mukaan, voidaanko vastauksen perusteella ns. "epäillä" ettei ole
        ymmärretty asiaa.

      + On suorastaan epäkohteliasta palauttaa lähdekoodia, joka ei
        käänny syntaksivirheen takia!

      + Palautettavan tiedoston muoto on tärkeä monesta syystä,
        (mukaanlukien puoliautomaattinen rekisteröinti Korppiin),
        joten ohjeet on tosiaankin luettava, jos mielii saada tehtävät
        läpi!

  * Aikataulut ja salit: Korpissa. (Päivittyy ekan kurssiviikon aikana.)
    TODO: uusi linkki

    Ryhmäohjauksia mikroluokissa vain käyntiin pääsemiseksi; sen
    jälkeen henkilökohtaisesti varattavia aikoja Tomilta; ohjeet
    Korppi-varauksiin tulevat listalle. Pääsiäisen alusviikolla täysi
    tauko opetuksesta; opiskelu ei ole kiellettyä ;). Luennoitsija
    suunnittelee olevansa pääsiäistauon ajan lomalla ja muilla mailla.

    Tomin ohjauksista: Henkilökohtaiset ajanvaraukset Korpin kautta
    (tiedotetaan ja ohjeistetaan, kun on varattavissa). Varaus ajoissa
    sen mukaan kuinka vaativiin "ongelmiin" tarvitsee apua. Kysymykset
    hyvä olla mietittynä, että aika saadaan paikan päällä käytettyä
    tehokkaasti. Kysyä saa paitsi demoista niin kurssin asioista
    muutenkin.

    Luennot ovat iltapäivästä - tehdään yhteinen ratkaisu, pidetäänkö
    niissä tauko vai jätetäänkö tauko pois ja lopetetaan aiemmin: TODO

  * Materiaalin reaaliaikainen tilanne -> YouSourcessa. Päivitysten
    julkaisu useimmiten 1-2 tunnin kuluttua luennon päättymisestä.

- Käytiin läpi määrälliset vaatimukset, jotka ovat jo näkyvillä myös
  nettisivulla ja palautusjärjestelmässä: Pakolliset demot ja
  tentti. Vapaaehtoiset demot ovat "porkkana" ja "täky" syvällisemmän
  osaamisen hakemiseen; kevään kurssin aikana niistä saa
  bonuspisteitä.

- Etenkin etäopiskelijoille, mutta myös muille, meillä on käytössä
  kaksi vertaistukikanavaa: yksi virallinen ja yksi epävirallinen:

    * Sähköpostilista itka203_kevat2017_keskustelu@korppi.jyu.fi on
      virallinen. Viestit arkistoituvat listan jäsenille, mutta eivät
      julkisesti. 

      Tarkoitus: kysykää apua kaverilta -> kaverit vastaa -> seuraavat
      kaverit oikaisevat, jos edellinen vastaus ei ollut aivan nappiin
      -> opettajat saattavat kommentoida ehtimisensä mukaan.

      Lista on erillinen, jotta informaatioähkyä välttävä opiskelija
      voi halutessaan poistua omatoimisesti listalta. Viralliset
      tiedotteet tulevat toisen listamme kautta, joka myös arkistoituu
      julkisesti.

    * IRC-kanava ircnetissä, jonka nimi on tässä "kryptattuna"
      seuraavan muotoinen: risuaitamerkki + kurssikoodi pienillä
      kirjaimilla. Sinne ei haluta ulkopuolisia, ja siksi
      kryptaus. Luennolla näytetään esimerkki. HUOM: IRC-palvelu EI
      ole Jyväskylän yliopiston tukema palvelu, eikä se ole kurssin
      tiedotuskanavana virallinen.

      Tarkoitus: jutelkaa pizzan tilauksen lisäksi tarvittaessa
      kurssinkin asioista -> yleensä ollut porukkaa hengaamassa, joten
      usein reaaliaikainen vastaus ongelmakohtiin -> nieminen idlaa
      kanavalla ja logaa keskustelua + vastaa ehkä ennen toukokuuta,
      jos on vastatakseen.

      Yksi täkäläinen IRC-ohje: http://linkkijkl.fi/ohjeita/irc-ohje/

Hieman ehdittiin jopa itse asiaankin luennon lopussa:

- Luentomuoto ja kurssin työkalut alusta alkaen ja esimerkit näyttäen:
  pääteyhteys, bash-shell ja tekstipohjaiset työkaluohjelmat.

- UNIX-käyttäjätunnuksen aktivointi salasana.jyu.fi -palvelussa.
- KiTTY -pääteohjelma (asennettava itselle, jos haluaa tehdä kotoa
  käsin; tehtävien palauttaminen kotoa käsin tulee vaatimaan
  lisukkeen, josta infoa ensimmäisen demotehtävän palautusohjeessa).

- HUOM: Windows-pääteyhteysohjelman (esim. KiTTY) todennäköinen
  ääkkösongelma ja sen korjaaminen: Omissa asetuksissa todettava
  etäkoneen merkistö; meidän tapauksessa UTF-8

- Maltettakoon toiseen luentoon asti ennen demojen aloitusta, jotta
  saadaan välttämättömät varoitukset (ja rohkaisut) alta pois.

** Luento 2: Luentomuoto, taustamateriaali, demo-ohjeistus, varoitukset(!)

Tästä luennosta alkaen mennään kaikki asiat juurta jaksaen käytännön
esimerkkejä näyttäen ja auki selittäen. Tavoite on, että viimeistään
demojen 1 ja 2 jälkeen opiskelijat uskaltautuvat myös itse kokeilemaan
samoja juttuja omatoimisesti. Turvallisuus- ja mukavuussyistä tämän
luennon varoitukset on syytä ensin sisäistää.

Mini-info: 

- Aikataulut löytyvät nyt Korpista, ja kurssin nettisivu jopa
  linkittää vuoden 2017 Korppi-kurssiin.

Kertaus on opintojen äiti:

- Vielä kerran näytään, mitä tapahtuu kulissien takana ennen luentoa:
  pääteyhteys, KiTTY-asetukset, screen, komentojen antaminen.

- Komento alussa, sitten argumentit. Kaiken näytetyn tulee sujua
  kahden viikon päästä jokaiselta mikroluokassa tai kotona ilman
  pienintäkään vaikeutta. Demot 1&2 opastavat alusta lähtien.

Sitten kohti itse asiaa:

- Mainintoja oppikirjoista

- Kurssimonisteen luonne. HUOM: Nyt alkakkee sukeltaa monisteeseen!

- Ensimmäinen vilkaisu "jyrkempään" taustamateriaaliin:
  AMD64-manuaalit, POSIX. Mitä ihmettä ja miksi?

- Havainto demojärjestelmästä: Meidän täytynee speksata palautustapa
  uudelleen (TODO: palaveri Tomin kanssa asap) HUOM: Tämä ei vaikuta
  mitenkään demojen tekemiseen - ainoastaan palauttamiseen ja
  tarkistamiseen.

- Miten lähdetään tekemään demoa 1: Alkuvaroitukset ja toisaalta
  rohkaisu.

- Ja sitten vaan tekemään!

** Luento 3: Yleiskuvaa, tavoitteita, esitietoja

- Tilanne demojärjestelmän suhteen: Varasuunnitelma on tehty ja
  Optima-työtila kurssia varten tilattu ylläpidolta. Noin viikon
  sisällä alkaa siis päästä palauttamaan. Mahdollisesti kuitenkin
  yrittäisimme "tehdä itse ja säästää" (siis säästää opiskelijan,
  vastuuopettajan sekä tarkastajan hermoja, joita tarkoituksia aiempi
  järjestelmä palveli erittäin hyvin).

  HUOM: Palautuslaatikon puute ei edelleenkään vaikuta mitenkään
  demojen tekemiseen - ainoastaan palauttamiseen ja tarkistamiseen. On
  tärkeää aloittaa demot, jos ei vielä ole sitä tehnyt!!

- Demo 1.. hiukan "teasereitä" sisällöstä

- Miten homma jatkuu demossa 2: Screen-ohjelman käyttely. Demoissa
  tulee paljon muutakin. Ajatuksella kannattaa tehdä, mutta aloittaa
  pian.


Mennään luentomonisteen puolelle:

- Sisällysluettelon pääotsikot suhteessa kansainvälisiin
  osaamistavoitteisiin. Samoja ovat.. jatkokurssien opettajat
  aika-ajoin kyselevät, mitä tällä kurssilla käsitellään. Päädyn
  lupaamaan noin yhden luennon mittaisen ensijohdannon aika monesta
  tärkeästä asiasta, joissa myöhemmin mennään syvemmälle.

- Johdanto: Kerrokset ja rajapinnat. Käyttöjärjestelmän rooli
  informaatioteknologian kokonaiskuvassa. Käyttöjärjestelmäkurssin
  rooli IT-alan oppisisällössä ja suhde muihin osaamiskohteisiin.

- Esitietojen varmistaminen: Mitä ohjelmointi 1 -kurssilta pitäisi
  muistaa ( ks. https://trac.cc.jyu.fi/projects/ohj1/wiki/sisallys )

- Esi- tai ennakkotiedot: Palautellaan mieleen Ohjelmointi 1 -kurssia:
  alkeistietotyypit, määrämuotoiset tietorakenteet ja
  taulukot. Ilmeneminen C:n lähdekoodissa (ei kovin erilaista kuin
  esim. C#:ssa tai Javassa, joiden syntaksi tarkoituksella jäljittelee
  C:tä).

- Pintapuolisia esi- tai ennakkotietoja kurssien Algoritmit
  1&2. -puolelta. Arkihavaintoja abstrakteista tietorakenteista:
  tietue/olio, taulukko, lista, jono, pino, puu.

HUOM: Hetimiten demon 1 & 2 ääreen ja lukemaan monistetta, jos ei olla
jo näissä menossa!!

** Luento 4: Lukujärjestelmät, motivoiva räjähdys, tietokonelaitteisto

Lukujärjestelmistä:

- lukujärjestelmät ovat tavallaan "esitieto", joka tavallaan käydään
  läpi Ohjelmointi 1:n sisällössä, mutta melko varmasti tarvitsee
  kertausta. Laitteiston lähellä toimittaessa välttämätön
  ymmärtää. Erityisesti binääri-, heksa- ja oktaaliluvut.

- Tarkentava kysymys yleisöstä: Negatiivisten kokonaislukujen
  esittäminen?

  Tyypillistä on kahden komplementtiesitys... palataan tähän varmasti
  myöhemmin. Heksana kirjoittaisin koodiin esim. -0x7B, jos
  tarkoittaisin kymmenjärjestelmän lukua -123. MUTTA, jos haluaisin
  ihan kirjoittaa 8 bittiä, jotka tarkoittais esim. etumerkillistä
  -1:tä kahden komplementtiesityksessä 8-bittisessä tallennustilassa,
  niin voisin kirjoittaa 0xff. -2 == 0xfe jne. 

  0xff + 1 (8-bittisenä) = 0x00
  0xff + 3 (8-bittisenä) = 0x02

  Jos olisi 16-bittinen tallennustila, niin -1 olisi 0xffff jne. Aina
  jos kaikki bitit on ykkösiä, niin kahden komplementtiesitys
  tulkitaan luvuksi -1.

  Heksalukuja tarvitaankin yleisimmin juuri silloin, kun nimenomaan
  bittiesityksellä on väliä. Näin ollen "-0x7B" on varmasti hyvin
  harvinainen tapa kirjoittaa koodiin vakio "-123"

- Googletellaan löytyisikö aihepiiriin liittyvä video edelleen haulla
  "Ariane 5 test launch". Kurssin asiat eivät ole rakettitiedettä,
  mutta rakettienkin kanssa toimittaessa ne täytyy ymmärtää,
  mm. lukujärjestelmät ja tallennustilan rajallisuus
  laitteistossa. Videolla paukahtaa puolisen miljardia euroa nätisti,
  koska 16 bitin mittaiseen tallennustilaan yritettiin laittaa luku,
  joka olisi tarvinnut useampia bittejä. Oli siinä muutakin, alkaen
  muuttuneista vaatimuksista (tavanomaista ohjelmistoissa) ja
  puuttuvista esitarkistuksista (tavanomainen paikka, josta
  säästetään, kun painotetaan aikatauluja). Lisätietoa, jos
  kiinnostaa:

  http://sunnyday.mit.edu/accidents/Ariane5accidentreport.html

- Kerratkaa tai opetelkaa ensimmäistä kertaa binääriluvut, heksaluvut
  ja oktaaliluvut!! Jatkossa katsotaan heksoja paljon!

Luennot 4-5 vaelletaan johdannon kerroskuvan matalimmilla tasoilla,
lähellä tietokonetta ja prosessorin rajapintaa.

Aluksi:

Välttämätön päällekkäisyys kurssin Tietokoneen rakenne ja
arkkitehtuuri kanssa (joka ei välttämättä mahdu samaan
sivuainepakettiin tämän kurssin kanssa):

- Tietokoneen perusrakenne (CPU, muisti, IO-laitteet, väylä)

- CPU:n välttämättömät osat (kontrolliyksikkö, ALU, rekisterit,
  sisäiset väylät); vähintään käskyosoiterekisteri (IP), jokin
  rekisteri laskutoimituksille sekä loogisia ehtoja kuvaavia
  lippubittejä.

- Nykypäivä: symmetrinen moniprosessorijärjestelmä / multicore

  [klusterit? pilvipalvelut? virtualisointi? - pääasiassa
  jatkokurssien aiheita; samoin rinnakkaislaskenta GPU:lla eli
  grafiikkaprosessorilla. Mainittakoon nämä kuitenkin ohimennen.]

- muistihierarkia (rekisterit, välimuistit L1, L2,.. , keskusmuisti)

  lokaalisuusperiaate mainittu jo myös. Jäi hyvin alustavalle tasolle;
  palattava aiheeseen myöhemmin tarkemmin!

- Aiempien vuosien yleisiä virhekäsityksiä demoissa 1 ja 2 (ehkäpä
  tänä vuonna osataan alusta lähtien, jos opitaan aiempien
  kurssilaisten virheistä :))

    + (muistakaa ekan demon varoitukset; pitää tietää mitä tapahtuu,
      ennen kuin laittaa sen tapahtumaan;)

    + jos pelottaa, voi tehdä kokeiluja palvelimella
      itka203-testi.it.jyu.fi missä ei voi häiritä jalavalaisia /
      halavalaisia.

    + välttäkää tarpeetonta monimutkaisuutta - esimerkiksi komento
      "echo `ps -u nieminen`" antaa echo-ohjelman tulosteen eikä
      tehtävänannossa pyydettyä ps-ohjelman tulostetta!! Voi olla,
      että "mystinen" ilmiö rivinvaihtojen puuttumisen suhteen saattaa
      selittyä tällä asialla, joka onkin vain väärä käsitys -
      korjataan käsitystä ja koettakaa palauttaa demoa 1 uudelleen,
      jos se on hylätty rivinvaihtoilmiöiden vuoksi. Koetetaan
      konkretisoida luennolla.

** Luento 5: Tiedosto, lähdekoodi, kääntäminen, konekieli, debugger

Demopalautus on nyt auki. Ohjeet:

- Katsotaan palautustapa Optimassa.

- Muista tarkistaa vastauksen muoto ennen palautusta, se vähentää
  viimekädessä kaikkien työtä, jopa omaasi!

- Ei kannata harmistua, jos ekalla kertaa tulee hylsy! Tavoitteena on
  oppiminen, ja Tomi laittaa hylätyn vastauksen kommenttiin
  hyödyllisiä vinkkejä, joiden kautta toivottavasti opitaan lisää!

- HUOM: Kun palautat uuden version mahdollis(t)en hysy(je)n tilalle,
  jätä kuitenkin myös edelliset järjestelmään. Tomin on silloin
  helpompi varmistaa, että aiempiin kommentteihin on reagoitu. On myös
  mahdollista paremmin todeta kehityksen suunta ja tarkentaa vinkkejä
  sitä kautta!

- HUOM 2: Tomi voi antaa hyödyllisiä kommentteja ja parannusehdotuksia
  myös hyväksyttyihin tehtäviin, joten kannattaa lukea ajatuksella
  kommentit, vaikka tehtävä olisikin teknisesti läpi!


Viime kerralta siirtynyttä [katotaan, mitä tehdään näille..]:

- Yllättävän monella on ollut oletuskuorena (shellinä)
  tcsh. Kertauksena opastus, miten vaihdetaan bash!

- Demon 2 sisällöstä: Moniajo, ps ja top -ohjelmat. Lisää viimeistään
  demossa 2 vastaan tulevia termejä: Prosessi,
  prosessi-ID. lapsiprosessi, vanhempiprosessi, prosessipuu.

- Palaamme myöhemmin: muistihierarkia (rekisterit, välimuistit L1,
  L2,.. , keskusmuisti)

POSIX-vartti:

- Mikä on POSIX? Kuka sen on tehnyt? Mitä se sanoo esimerkiksi tällä
  luennolla tai aiemmin nähdyistä asioista?

  + Suositellaan iltalukemiseksi alun yleiskuvaukset ja rajaukset -
    POSIX ei ota kantaa laitteistorajapintaan eikä käyttöjärjestelmän
    sisäiseen rakenteeseen; kyseessä siis nimenomaan
    rajapintadokumentaatio käyttöjärjestelmäkerroksen ja
    sovellusohjelmakerroksen välissä. C, minimalistiset kirjastot,
    shell-komentokieli ja tietty minimijoukko apuohjelmia /
    komentoja. Vain tekstiä; ei mitään grafiikkaan liittyvää.

  + Base definitions Intro: (mm. XBD Sec. 1.7 "Portability"),
    Modulaarinen rakenne, laajennukset ja marginaalihuomioiden
    formaatti.


Pyöritään luennoilla kuitenkin hetken verran laitteistorajapinnassa
niin konkreettisesti kuin pystytään. Käytetään apuna mahdollisimman
matalatasoista käyttäjärajapintaa (shell, C-kieli). Lähdetään sitten
hiukan nousemaan sieltä kohti ohjelmistorajapintoja asteittain.

- Demo 3:n esittely; tehdään samoja asioita, joita siinä demossa on
  tarkoitus omin käsin toistaa ja toivottavasti myös miettiä läpi..

  C-ohjelman kääntäminen.

- Konekielisen ohjelman suoritus. "Hei maailma" taas kerran, tällä
  kertaa C-kielellä. Toteutus:

    + tehdään shellissä hakemisto tämän vuoden esimerkkikoodeille
      (komento mkdir)

    + vaihdetaan työhakemistoksi tuo kyseinen hakemisto (komento cd)

    + editoidaan yhdessä screen-ikkunassa ja kokeillaan toimintaa
      toisessa; opettele tekemään näin, niin säästät aikaa pidemmän 
      päälle

    + raapustellaan koodi sisään alusta lähtien

    + kokeillaan kääntämistä ja ajamista

- Lähdekooditiedoston sisällön katselua hexdumpilla (ja ehkä myös
  POSIXin määräämällä oktaalivedostajalla "od"). Normaali
  tekstitiedostohan se vain on..

- Katsotaan tiedoston metatietoja (jotka on tallessa eri paikassa kuin
  tiedoston sisältö - komennot "ls -l" sekä "stat"); myös tiedoston
  nimi ja osoite hakemistopuussa on erillinen sen sisällöstä, eikä
  nimellä ja sisällöllä ole teknisesti tekemistä keskenään.

- Tutkitaan mm. rivinvaihtojen ja skandinaavisten kirjaimien
  kuvaamista tekstitiedostossa. Mainittakoon UTF-8 -merkistökoodaus
  (yksi Unicoden koodaus). 

  Ehkä myöhemmin: ASCII sekä POSIXin minimaalisin merkistökoodaus.

- Jotta ohjelma voidaan ajaa, se pitää kääntää C-käntäjällä. Katsotaan
  käännetyn, suoritettavan ohjelmakooditiedoston (ELF-formaatti)
  sisältöä hexdumpilla ja etsitään sieltä kohta, jossa "Hello world"
  löytyy selväkielisenä. Oli lopulta "Häi häi mualima" tjsp., missä
  nähtiin ä-kirjaimen koodaus Unicoden UTF-8 -muodossa.

- [Viime vuosien tapaan..] pidetään ohjelmistossa perinteinen
  luennoitsijan elvistelysetti.. eikäs kun yksi esimerkki kurssin
  opeista, joka saattaa joitakuita motivoida.

** Luento 6: Debuggeri, konekieli. Ohjelman argumentit ja virhekoodi

Tähän jäätiin:

- Mainitaan viime kerran harrastusprojektille muitakin käyttökohteita
  reaalimaailmassa: pakkausalgoritmit, kaistanleveys ym. Tärkeintä
  kumminkin, että harrastuskentällä on mahdollista oppia asioita,
  joista voi olla yllättävää hyötyä töissäkin.

Seuraavaksi tarina elävästä elämästä:

- Tänään on "Päivä, jona IT-palveluissa iloittiin" eli "Just another
  day in the IT paradise". Ovat kiitollisia vikailmoituksista jne :)

- Iloitaan me siitä, että "top" ja "ps -f" -komennot toimivat taas
  yliopiston Linux-palveluissa.

- (Demoteksteissä mainitun testipalvelimen osalta tiketti edelleen
  sisässä ja selvittely jatkuu. Toivottavasti tämäkin hoituu.)

- Tarinan opetus: IT-alalla haluat olla se, joka ratkaisee ongelman,
  mieluiten nopeasti. Miten? Ymmärtämällä, mitä konepellin alla
  tapahtuu, jotta voit keskittää vianhakua kohti todennäköistä
  lähtökohtaista syytä. Vauhdikas pohtiminen ja mahdollisten
  skenaarioiden poissulku jäi päälle IT-palveluissa klo 14, ja klo
  15:30 ongelma oli korjattu. Meitsi ainakin fanittaa!

Huvin vuoksi ja löytämisen ilon kannalta:

- Tarkastellaan erilaisia tiedostoja heksavedoksena.. vaikkapa
  kuvatiedostoja (JPG, PNG) ...

- Entäpäs tämä: http://users.jyu.fi/~nieminen/kj17/mystery1 

- Tarina elävästä elämästä: kaksi tohtoriopiskelijaa kauan, kauan
  sitten..

- Toivottuja opetuksia: haluat olla se, joka ratkoo pulmat vahvan
  ymmärryksen kautta. Toisaalta haluat uskaltaa kysyä neuvoa ennen
  kuin on mennyt liian kauan aikaa ongelman parissa.

Sitten jatketaan "Hei maailma" -ohjelmasta. Edelleen huvin vuoksi ja
löytämisen ilon kannalta...

- gdb -debuggeriohjelma: bitti bitiltä, tavu tavulta, helloworldin
  pääohjelmassa suoritettavat konekieliset käskyt ja vasemmassa
  laidassa muistiosoitteet, joissa ne ovat tallennettuna silloin, kun
  ohjelma on käynnissä. (Huom: tässä kohtaa puhutaan vahvasti
  laiterajapinnasta, johon esim. POSIX _ei_ ota kantaa; niinpä
  työkalut ovat sidoksissa GNU-tuotoksiin, tiedostoformaatit Linuxiin,
  ja konekieli AMD64 prosessoriarkkitehtuuriin, jotka meillä
  yliopiston palvelimelta löytyvät. Huolellisesti POSIXin mukaiseksi
  tehty C99 -kielinen ohjelma kuitenkin voitaisiin kääntää mihin
  tahansa POSIX-yhteensopivaan järjestelmään, eli se "kelluu"
  abstraktin rajapinnan päällä!)

    + katsottin AMD64-manuaalia:

         * Idea konekielisten tavujen muodostumisesta

         * Esimerkki käskyn esittelystä, "PUSH" .. erityisesti löytyi
           rajapintadokumentaatio sille, miksi "push %rbp" on
           konekielellä nimenomaan heksa 0x55

Konekielisen ohjelman suoritus. "Hei maailma" jatkuu. Uusia
esimerkkejä debuggerilla:

- Askeltaminen lähdekoodirivi kerrallaan, "step"

    + mitä tapahtuu, kun askelletaan ohjelman "lopun" ohi eli
      main()-aliohjelman returnin ja viimeisen aaltosulun jälkeen?
      (havaittiin, että päädytään C:n standardikirjaston puolelle,
      josta järjestelmäämme ei nyt ole asennettu lähdekoodia tai
      debuggaustietoa, joten debuggeri havaitsee että se ei voi nyt
      paljoa enempää näyttää ja antaa standardikirjaston hoitaa
      ohjelman lopputoimet.)

- Askeltaminen konekäsky kerrallaan, "stepi" (step instruction).
  Havaintoja:

    + Tulostusrivin kohdalla alustakirjasto tekee paljon vaikka
      mitä.

    + Debuggerissa voi pyytää tällaisen toisten tekemän
      ei-kiinnostavan aliohjelman suorittamista sen loppuun saakka
      komennolla "finish".


Ohjelman kytköksiä toimintaympäristöönsä: argumentit ja virhekoodi

- Lavennetaan "hei maailmaa" käyttämään argumenttejaan.

- Tehdään jotain myös virhekoodilla


HUOM: Tuoreeltaan paikkauksia luennolla puhuttuun lööperiin:

- Ei sitte kukaan yleisöstä huomauttanut asiasta: 0x55 on tietysti
  bitteinä 0101 0101 eikä 1001 1001! Päässälaskuvirhe kakkosen
  potensseissa.

- Väärästä dokkarista yritin aluksi löytää aliohjelmakutsun
  ABI-sopimuksia.. ei olis löytynyt siitä. SysV ABI AMD64 supplement
  (jota vilkaistiin kyseisestä kohdasta myöhemmin oli oikea). Sama
  harva pää kesät talvet, kun äkkiseltään yrittää muistella jotakin.

- ei siellä IT-palveluissa oikeasti ehkä aivan 10000 järjestelmää
  ole..  kymmeniä :) Ajatusvirhe kymmenen potensseissa.. Ekalla kertaa
  nää menee ittellä aina väärin, ja sitten pittää debugata... täytyy
  vaan tarkistaa kymmenen potenssit loppuun ennen kuin vaikka
  allekirjoittaa kauppakirjan, jossa on joku eurosumma.

** Luento 7: Prosessi, virtuaalimuistiavaruus 

Alkuun pieni esimerkki shellin käyttämisestä tiedonlouhintaan
liittyvässä tutkimuksessa:

    + Alustava kokonaiskuva ennen näkemättömästä datasetistä: minkä
      muotoinen tiedosto, kuinka paljon, miten jakautunutta (karkeasti
      ottaen)

    + Erotinmerkin muuttaminen (tässä pilkku -> välilyönti), mikäli
      halutaan ladata käsittelyyn ohjelmalla, jolle alkuperäinen
      erotinmerkki ei käy. Vastaavasti voisi muuttaa myös
      esim. desimaalierottimen.

    + Shellin perustyökaluilla pystyy tekemään paljon muutakin
      hyödyllistä ensivaiheessa, ennen siirtymistä varsinaisen
      tutkimusohjelmiston käyttöön.

    + Todellisessa tilanteessa data voi tulla asiakkaalta hyvinkin
      kummallisessa muodossa, jota ei suoriltaan pysty lataamaan
      työkaluihin, eikä asiakkaan edustaja välttämättä itse edes
      tiedä, mikä tiedostomuoto on. Ensimmäinen vaihe voi siis
      hyvinkin olla "reverse engineering" -tyylistä.

Ohjelman kytköksiä toimintaympäristöönsä: Aiemmin nähty argumentit ja
virhekoodi. Katsotaan vielä seuraavat: 

- standardiulostulo (C:n stdout, vastaa esim. Javan System.out'ia),
  standardivirheulostulo (C:n stderr)

- ympäristömuuttujat (demo 3:n asiaa), voi asettaa shellissä (myös
  skriptissä), exportatut ympäristömuuttujat periytyvät
  lapsiprosesseille eli ohjelmille, jotka kyseinen shell käynnistää.

- samalla metataitoja: kun unohtuu, miten joku juttu toimii jossakin
  kielessä tai alustassa, niin nopein Googlettaja (joka osaa vielä
  soveltaa netin pirstaleisia ohjeita omaan työn alla olevaan
  ongelmaan) on voittaja. Löytyi helposti getenv() -kutsun
  manuaalisivu. Totuus on esim. POSIX-standardissa, mutta nettisivukin
  vaikutti tässä tapauksessa luotettavalta.

- NULL-osoittimen luonne: tarkoittaa "osoitetta ei ole olemassa",
  mutta koodataan kokonaislukuna kuten muutkin
  muistiosoitteet. Saattaa olla kääntäjästä riippuen esim. 0, mutta on
  silti syytä kirjoittaa isoilla kirjaimilla vakiona NULL.

Sitten eteenpäin:

- Askeltaminen konekäsky kerrallaan, "stepi" (step instruction).

- Askelletaan esimerkkikoodia konekielinen käsky kerrallaan ja
  tarkkaillaan muutoksia rekistereissä kunkin käskyn jälkeen:

    + GDB:n käsky "stepi" askeltaa konekielinen käsky kerrallaan,
     "disassemble" näyttää koodin ja kohdan, missä ollaan menossa.

    + prosessin konteksti eli prosessorin rekisterien sisällöt: gdb:n
      käsky "info registers" näyttää kaikki sovellusohjelman käytössä
      olevat yleis- ja toiminnanohjausrekisterit.

      Onko prosessorissa näiden lisäksi muita rekistereitä? Kyllä on,
      joitain kymmeniä kappaleita. Manuaali kertoo näistä totuuden ja
      luentomoniste kiteyttää suomeksi oleellisimmat pääkohdat.

    + Vilkaistaan luentomonisteen listaa x86-64 -prosessorin
      yleisrekistereistä.

- Todettiin RIP eli käskyosoiterekisterin muuttuminen
  peräkkäissuoritteisissa käskyissä ja jopa JG (jump if greater)
  ehdollisessa hyppykäskyssä. Ts. prosessorin nouto-suoritus-syklin
  toteaminen.

- Virtuaalimuistiavaruus on syytä käsitellä alustavasti:

    * Jokaiselle prosessille luodaan oma virtuaalinen
      muistiavaruus, eli osoitteisto 0..MAKSIMI, jotka prosessorin
      muistinhallintayksikkö (MMU) kartoittaa automaattisesti
      fyysisiksi osoitteiksi. Yksi käyttöjärjestelmän tehtävä on
      tiedottaa prosessorille kunkin prosessin muistikartta eli
      osoitteiden muuntaminen virtuaalisista fyysisiksi. Tähän
      palataan kokonaisen luennon verran myöhemmin.

    * Ohjelman tyypilliset alueet (koodi, data, keko, pino)
      sijoitetaan yleensä tiettyihin alueisiin prosessin
      virtuaalimuistia. Tietyn käyttöjärjestelmän osalta on sovittu
      ABI (Application Binary Interface). Esim. AMD64-prosessorin
      päällä Linuxissa on sovittu käytettäväksi kyseiselle
      prosessorille adaptoitua "SysV ABIa".

** Luento 8: Osoitteen tulkinta, MMU, käyttöjärjestelmäkutsu, käyttäjätila, käyttöjärjestelmätila

Edellinen loppuun:

- Virtuaalimuistiosoitteiden tulkinta alustavasti.

Demo 4:n ensiesittely, että halutessaan pääsee pääsiäistauolla
tekemään. Luennoitsija yrittää olla lomalla ja vastailematta ensi
viikon ja pääsiäisen ajan! Sallittakoon opiskelijallekin, jos tarvii
hetken hengähdyksen kevään keskelle :)

Demo 4:n alustava esittely: Kyseessä on "minimaalinen suomenkielinen
tutoriaali C-kieleen, olettaen että lukija tuntee jonkin oliopohjaisen
C:hen perustuvan kielen, esim. C# tai Java.

Saa alkaa tekemään demoa 4. Siihen tullee menemään eniten aikaa
kaikista demoista (jos se tehdään ajatuksella, kuten tarkoitus
olisi!). Palautettava osio on jälleen paljon pienempi kuin arvosanaan
1 tähtäävä minimiymmärrys, ja erittäin paljon pienempi kuin arvosanaan
5 tähtäävä laajempi ymmärrys. HUOM: Historia on osoittanut, että
Ohjelmointi 1 ja jopa Ohjelmointi 2 on ollut mahdollista kahlata läpi
ilman kykyä ratkaista tässä demossa vaadittua pientä algoritmista
"pähkinää". Ei kannata hätääntyä, jos ei meinaa onnistua... vaan mitä
kannattaa tehdä? _Kysyä apuja_!!

Ja muistakaa Tomin huomio aiemmalta luennolta: kyllä se on sangen
epäkohteliasta palauttaa koodi, joka ei edes käänny syntaksivirheiden
vuoksi. Eli nyt, kiitos, kunnioittakaa demon tarkastajaa sen verran,
että palautatte version, joka kääntyy (ja parhaimmillaan tietysti myös
tekee sen, mitä pyydetään).

... 

DONE: Open pääsiäistehtävä: random paluuarvo jättämällä "return 0"
pois mainista. (Ei tehtävissä, ks. alempana!)

C:llä, assemblerilla ja debuggerilla vielä hetki:

- ohjelman jäljitys strace -apuohjelmalla, joka näyttää kaikki tehdyt
  järjestelmäkutsut.

- Sitten täsmennetään tekninen ymmärrys käyttöjärjestelmän
  kutsurajapinnasta (System call interface):

    + Käyttöjärjestelmäkutsu exit() matalan tason C-apukirjastosta.

    + Suora Linuxin käyttöjärjestelmäkutsu, myös tuttavalliselta
      nimeltään "exit()". Ensimmäinen toteutus C:n epästandardina
      inline-assemblynä. Ei jatketa tällä tiellä yhtään
      pidemmälle... Toimii samalla tavoin vain yhdellä kääntäjällä
      (meillä GNU C), yhdellä käyttöjärjestelmällä (meillä Linux) ja
      yhdellä prosessoriarkkitehtuurilla (meillä x86-64).

    + Puhdas Assembler-ohjelma. Motivoidaan kerroksittaisten
      abstraktioiden käyttöä.

- Käyttöjärjestelmäkutsun toimintaperiaate (esimerkki helloasm.s):

    + AMD64:n konekielikäsky 'syscall' keskeyttää prosessin oman
      suorituksen ja "siirtää kontrollin" käyttöjärjestelmän koodin
      puolelle. Käyttöjärjestelmä tekee sitten, mitä haluaa -
      toivottavasti sen, mitä sen rajapintadokumentaatiossa
      ilmoitetaan. Käyttäjän prosessi jatkuu sen jälkeen, kun
      käyttöjärjestelmä on toteuttanut pyydetyn palvelun. Tietysti jos
      palveluna pyydetään prosessin itsensä päättymistä eli kutsu on
      exit(), niin paluuta suoritukseen ei koskaan enää pitäisi olla.

    + Katsotaan vielä hiukan AMD64-prosessorimanuaalia. Pääosiot ovat
      "1: Sovellusohjelmoijan käsikirja", "2: Järjestelmäohjelmoijan
      käsikirja" sekä "3: Käskyreferenssi". Viikko sitten
      silmäiltiinkin jo hiukan käskyn MOV referenssiä..

      Nyt silmäiltiin päällisin puolin käyttöjärjestelmäkutsun eli
      SYSCALL-käskyn selitys pseudokoodeineen. Kuten mainittu,
      manuaalit ovat hyvää, unettavaa, mutta sivistävää iltalukemista.

    + Luennoitsija osasi tehdä Helloworldin tarvitsemat
      käyttöjärjestelmäkutsut write() ja exit() katsomalla tästä
      varsin helppokäyttöisestä, Googlen kautta helposti löytyneestä,
      kokoelmasta, mitä missäkin rekisterissä pitää olla siinä
      vaiheessa, kun syscall-käsky tehdään nykyisessä Linuxissa:
      https://filippo.io/linux-syscall-table/

    + Käyttöjärjestelmäkutsu on erittäin primitiivinen toimenpide, ja
      puhtaassa apukirjastoja käyttämättömässä
      assembler-ohjelmoinnissa välttämätön. Nyt kun sen toiminta on
      kertaalleen nähty, hyväksytään se, että päällä on esimerkiksi
      C-kielellä tehtyjä matalan tason apukirjastoja sekä lisäksi
      esimerkiksi POSIX-yhteensopivuuskirjasto, jos jokin
      käyttöjärjestelmä pyrkii olemaan kyseisen standardin mukainen.


Oma "pääsiäisläksyni" eli pääohjelma, jossa ei ole eksplisiittistä
return-lausetta lopussa... tämähän se tuotti hämmennystä ja "huonon
esimerkin", kun en saanut kääntäjää varoittamaan ja kieltäytymään
omaan silmääni vaaralliselta näyttävästä koodista... No.. läksy oli
helppo, koska pääsiäisläksyn tehtävä eli nollasta poikkeavan
virhekoodin jättävä ohjelma olisi ollut faktisesti mahdoton tehdä:
C99-standardi määrittelee seuraavaa main()-aliohjelman loppumisesta
(luku 5.1.2.2.3)::

  5.1.2.2.3 Program termination

    If the return type of the main function is a type compatible with
    int, a return from the initial call to the main function is
    equivalent to calling the exit function with the value returned by
    the main function as its argument; reaching the } that terminates
    the main function returns a value of 0. If the return type is not
    compatible with int, the termination status returned to the host
    environment is unspecified.

Siellähän se standardissa luvataan: "reaching the } that terminates
the main function returns a value of 0". Tältä osin kaikki kunnossa,
ja itsekin olen yhtä asiaa viisaampi. Ja esimerkistä tulikin hyvä :) 
sovitaan vaan, että se käsitteli asioiden tarkistamista standardista,
jos joku alkaa käytännössä ihmetyttämään.

Silti suosittelen kirjoittamaan lähdekoodiin "return 0":n niin ei tule
ihmetystä eteen niillekään, jotka eivät ole yhtä tarkkaan lukeneet speksiä.

Tämä löytyi ensin Googlettamalla ja sitten varmistamalla itse
C99-standardista (ISO/IEC 9899:1999), että näin se on komitea mennyt
sopimaan. Ehkä tämä määritelmä auttaa keskimäärin vähentämään
ohjelmointivirheitä, kun porukka kumminkin unohtaa sen return 0:nsa
kirjoittaa, eikä tajuaisi muuttaa kääntäjän varoituksia virheiksi :).


Vastaus luennolla esitettyyn tarkennukseen kirjastofunktioiden
linkittämisestä käynnistysvaiheessa, eikä enää varsinaisen ajon
aikana:

Ainakin GNU:n työkaluilla ELF-muotoiseen ohjelmatiedostoon voi laittaa
pyynnön kirjastojen linkittämisestä heti ohjelman latauksen yhteydessä
seuraavalla komennolla (osio "-Wl,-z,now")::

  c99 -Wl,-z,now -Werror -g -O0 -o omaecho omaecho.c

Merkintä tulee luonnollisesti aivan viimeisessä työkaluketjun
vaiheessa eli linkitysohjelmassa "ld". Vastaus löytyi kuin löytyikin
helpoiten selaamalla ld:n manuaalia ja tarkistamalla c99-komennolla
käynnistyvän julkisivuohjelman manuaalista, miten ld-vaiheelle saadaan
tuupattua argumentteja. "-Wl,-z,now" johtaa siihen, että
ohjelmatiedoston kasaamisvaiheessa konepellin alla ajettava komento
"ld" saa mm. peräkkäiset argumentit "-z" ja "now". Oletusarvoisesti ld:n
ajo tulkitaan kuten "-z lazy" eli jaetut kirjastot ladataan laiskasti vain
tarvittaessa, eli kun jotakin kirjastossa sijaitsevaa aliohjelmaa
faktisesti kutsutaan.

** Luento 9: C-kieli, linkitys, pinokäskyt push&pop.

Vuonna 2017 tässä kohtaa oli yli viikon pääsiäistauko ja opettaja
todellakin offline, kuten tarkoitus (ja tarve) olikin. Kerätäänpä
ajatukset kurssin puolivälissä ja tehdään tilannekatsaus, missä kohtaa
pittäis olla menossa materiaalien osalta (moniste, demot) ja paikataan
tarvittavat pätkät välimaastosta.

Luennon alussa vastauksia viime kerran kysymyksiin (ks. edellisen
luennon loppu)

Kertailtiin aiempaa:

- katsottiin konekielistä Hello worldiä ja käyttöjärjestelmäkutsun
  tapahtumista sovellusohjelmassa.

Varmistettiin luentomonistetta ja käytännön debugger-esimerkkejä
katsellen sisältö luentomonisteen lukuun 5.2 saakka, mm:

- ELF-tiedoston formaatti (vilautettiin speksiä PDF:stä)

- Havainto: Myös ELF-spekseissä on C-kielellä määriteltyjä "typedef
  struct{...sisältö...} TyypinNimi" -rakenteita. Käyttöjärjestelmän
  konkreettisen toiminnan ymmärtäminen edellyttää jonkinlaista kuvaa
  C-ohjelmoinnista, ei kiertotietä!

- selväkielisempi listaus ELFin sisällöstä: objdump -x a.out tmv.

- muistin tarkastelu debuggerissa.. lisäesimerkki debuggerin
  komennosta "x" (eli "eXamine"), jolla voi tutkia ladatun ohjelman
  muistia nimenomaan halutun muistiosoitteen kohdalta. Esimerkki:
  Varmistettiin, että osoitteeseen 0x400000 on ladattu
  ohjelmatiedoston alku eli jo aiemmalla luennolla nähty pötkö, joka
  alkaa ELFiä käyttävissä järjestelmissä aina samoilla neljällä
  tavulla 0x7f, 'E', 'L', 'F'.

Yhteenveto tietokoneen perustoimintaperiaatteesta: prosessori
suorittaa yksinkertaisen käskyn, joka muuttaa kontekstia
(ts. rekisterien sisältöä) -- vähintäänkin käskyosoiterekisterin
sisältönä tulee olemaan aina seuraavaksi suoritettavan käskyn osoite.

Johtopäätös: konekieli, assembly ja käyttöjärjestelmäkutsu ovat
tavattoman yksinkertaisia ja "putkiaivoisia" rajapintoja. Niiden
käyttäminen ja alustasta riippumattomien ohjelmien tekeminen
edellyttää korkean tason kieliä sekä kerroksittaista apukirjastoa,
jonka välttämättömät ominaisuudet esim. POSIX määrittelee tietyllä
abstraktiotasolla. Ts. "yksinkertainen != helppo".

Pidetään konkretia mielessä, mutta käytetään jatkossa pääasiassa
POSIXin määräämiä palvelukutsuja. Osa niistä on yksi-yhteen Linuxin
kutsurajapinnan kanssa, koska molemmat pohjautuvat samaan
historialliseen pohjaan (ikiaikainen unix). Osa voi kuitenkin tarvita
lisäoperaatioita yhteensopivuuskirjaston koodissa. Täydellinen totuus
on Linuxin ja GNU C-kirjastojen nykyversioiden lähdekoodissa; me
luotamme POSIXissa sovittuun sovellusrajapintaan, ja katsotaan sitten,
tuleeko mahdollisesti ongelmia suorakäyttökoneidemme "jotakuinkin"
POSIX-yhteensopivan Linux-jakelun kanssa.

** Luento 10: C-kieli, Aktivaatio, kutsupino debuggerissa. 

Alkuun "YPE-hype" (eli omien yliopistopedagogisten opintojeni
hurmoksen herättämä interaktiohetki):

- Muodosta lähimpänä istuvien 2-3 henkilön kanssa keskusteluryhmä;
  keskustelkaa seuraavasta kysymyksestä demo4:n ja tähän asti
  luennoilla käsitellyn valossa:

  + Mikä tällä hetkellä askarruttaa eniten C-kielessä?

    (esim. suhteessa aiemmilta kursseilta tuttuihin kieliin, muihin
    aiempiin ohjelmointikokemuksiin tai ennakko-odotuksiin? Keskustelu
    saa rönsyillä muihinkin suuntiin, kunhan pyörii C:n ympärillä.)

- Keskustelun löydöksiä (luentovideo alkaa tästä kohtaa):

  + "viitemuuttujat", ts. viedään aliohjelmalle **muistiosoite**.

  + miksi Windowsin ja Linuxin (tai ylipäätään eri
    käyttöjärjestelmien) C-ohjelmat eivät ole yhteensopivia keskenään?
    HUOM: Ne *ovat* yhteensopivia, jos niissä (1) ei kutsuta
    käyttöjärjestelmäriippuvaisia aliohjelmia ja (2) ohjelmat
    käännetään uudelleen (ABI määrää mm. miten aliohjelmia kutsutaan
    konekielessä; ABI on käyttöjärjestelmän tekijän valinta ja riippuu
    aina prosessoriarkkitehtuurista.)

  + (on ihan OK, jos tässä vaiheessa "ei osaa vielä muodostaa
    kysymystä". Toivottavasti se on pian mahdollista!)

  + C:n "listat"? HUOM: Lista on teknisesti eri asia kuin taulukko
    (ks. esitietoluku monisteesta!) Kysymyksessä tarkoitettiin
    taulukkoa ``int taulukko[3]`` - miksi se sallii kirjoittaa
    ``taulukko[1000] = 42`` Noh.. C yrittää tehdä mahdollisimman
    "vähän" ja jättää loput ohjelmoijan vastuulle. HUOM:
    käännösvaiheessa voi olla vaikea tietää, mihin
    sijoitetaan. Esim. ``taulukko[i] = 42``. Itse pitää ohjelmoida
    esim. ``if (lkm > maximi) error("") else ...``

    Voi aina tehdä kirjaston, joka hoitaa esim. tarkistukset. 
    ``turvallinen_taulukko_lisaa(taulukko, maksimi, indeksi, arvo);``

    HUOM: C:n taulukko on erilainen (yksinkertaisempi) kuin
    modernimpien kielien automaattisesti skaalautuvat ja rajat
    tarkistavat luokat.

  + "Eikö ne 1970-luvulla 'tajunneet' tehdä taulukosta
    turvallisempaa"? Historiikeista voi selvitä. Joka tapauksessa voi
    olla suorituskykykysymys.

  + Miksi muistivuotojen hallinta ja muu resurssien vapautus on
    ohjelmoijan vastuulla C:ssä? Vastaus on kysymyksessä: Milloin
    pitäisi vapauttaa? Vaatii ajonaikaisen järjestelmän, joka
    tarkkailee resurssin tarvetta. Uskomukseni on, että ainakin
    osittain tavoite on ollut vähentää alustan
    monimutkaisuutta. Myöskin tutkimus kielten toteutuksessa on elänyt
    omaa raidettaan 1970-luvun jälkeen, kun C syntyi.

  + Mikä on .c, .h ja .o -tiedostojen suhde toisiinsa? Ks. demo3 ja
    demo4 tehtäväohjeet.

Tästä jatkuu itse asia sitten:

- Tavujärjestys (byte order), jos jotakuta on ihmetyttänyt
  (parhaimmillaan on ihmetyttänyt!)? AMD64:ssä on "little-endian"
  -järjestys. Kokeillaan luvulla 0x0123456789abcdef, jonka
  tavujärjestys on helppo varmistaa vaikkapa debuggerin tulosteesta.

Sitten jälleen mukavasti "tutuksi ja turvalliseksi tulleen" demo4:n
mallikoodin ja samalla tapaa tutun tekstimuotoisen debuggerin parissa:

Isompi ohjelma, jossa on vaikkapa aliohjelmakutsuja ja silmukoita:

- Askelletaan demo 4:n esimerkkikoodia lähdekoodirivi kerrallaan
  debuggerilla. Havainnoidaan kutsupinoa, jonka tilanteen saa gdb:ssä
  näkyviin komennolla "backtrace" tai lyhennettynä "bt". Muita nimiä
  ainakin aktivaatiopino, suorituspino.

- Katsotaan vähän vinkkiä demo4:n palautustehtävän
  aloittamiseksi. Entä jos tulee vahingossa "ikuinen silmukka"?
  (Helposti käy...) Ctrl-C, debuggeri ja tarkkaavaisuus koodaamisessa
  auttavat.

- aliohjelmakutsu, kutsupino

- debuggerin näkymä kutsupinoon, 'backtrace'-komento näyttää pinoon
  kullakin hetkellä kertyneet aliohjelma-aktivaatiot.

** Luento 11: Ohjelman jälki, kutsupino konekielessä, ABI 

Täydennystä edellisiin aiheisiin:

- Näkökulmia viime luennon keskusteluhuomioihin:

  + C on lähtökohtaisesti suunniteltu "laiteläheiseksi" - esimerkiksi
    lähdekoodissa näkyvät rakenteet vastaavat datan sijoittumista
    tietokoneen muistiin niin, että mitään ei ole tai tapahdu
    "piilossa". Mm. tämän lähtökohdan vuoksi C (ja sittemmin C++)
    soveltuvat käyttöjärjestelmien ja muun laitehallinnan
    toteuttamiseen: datan sijainti tietokoneen muistiavaruudessa
    nähdään suoraan, koska struct-rakenteet ja taulukot (mukaanlukien
    merkkijonot) ovat kiinteitä, peräkkäin sijaitsevia pötköjä.

  + Mitä muuta C:n yksinkertaisuudesta seuraa? Mahdollisimman pieni
    määrä ajonaikaista alustakoodia - mm. siksi C soveltuu sellaisten
    pienten prosessorien ja mikrokontrollereiden ohjelmointiin, joissa
    ohjelmalle tai datalle ei yksinkertaisesti ole kovin paljon
    tilaa. Tällaisten valmistus ja siten käyttäminen tuotteiden osana
    on luonnollisesti halvempaa (=tarkoituksenmukaista) kuin isompien.

  + Miksei C:ssä olisi edes käännösaikana estetty taulukoiden tilan
    ylittämistä? Itse asiassa kääntäjät osaa varoittaa aika
    hyvin. Käytä oikeassa ohjelmassa -Werror argumenttia gcc:ssä

- Merkkijonon ilmeneminen laiteläheisessä ohjelmoinnissa ja siten
  esim. C-kielessä: muistiosoite nollaan päättyvän tavujonon alkuun.

    + varmistutaan asiasta debuggerilla - komento "x/s"

    + Linuxin uusimman version toteutus käyttöjärjestelmäkutsun
      "vastaanottopuoleksi", arvatenkin GNU Assemblerilla
      toteutettuna:
      http://lxr.free-electrons.com/source/arch/x86/entry/entry_64.S#L99

      Eli tasan tarkkaan se, mitä prosessorin käsketään tehdä
      välittömästi sen jälkeen, kun käyttäjän prosessin SYSCALL on
      takana päin nyky-Linuxissa. Tämä osio vaatii mm. tiettyjen
      rekisterien tilan tallentamista, joten se on pakko toteuttaa
      konekielellä. Järkevää tämä on tietysti vain symbolisena,
      ihmisen ymmärtämänä, assemblerina, jonka syntaksi mukailee
      prosessorin dokumentoitua käskykanta-arkkitehtuuria.


Jatketaan demo4:n esimerkkikoodeilla ja luentomonisteen
pinokehyssarjakuvasta.

Esimerkki:

- Aloitetaan demo4:n palautustehtävän koodausta loogisesta paikasta.

- Mitä tapahtuu, ja mitä voi tehdä, jos vahingossa tulee ikuinen
  silmukka?

- Perinteinen "kaikenlaskija" -esimerkki demonstroimaan aikakatkaisun
  tarvetta.

Aliohjelmien ja pinon käyttö (osin jo myös demon 5 aihepiiriä):

- klassinen pinokehysmalli, aktivaatiotietueen rakentuminen pinon
  päälle: kutsuva koodi pinoaa parametrit, call-käskyn suoritus pinoaa
  automaattisesti paluuosoitteen, kutsuttu koodi pinoaa edeltävän
  aktivaatiotietueen kantaosoitteen (BP) talteen, kiinnittää oman BP:n
  ja varaa omille paikallisille muuttujilleen tilaa vähentämällä
  SP:stä sen verran kuin paikallinen data tarvitsee
  tavuja. Ylösalaisin piirretyssä kuvassa (muistiosoite 0 kuvan
  ylälaidassa) pino kertyy visuaalisessa mielessä ylöspäin.

- Huomautus aktivaatiopinosta: Pinoon tallennetuista BP-osoitteista
  muodostuu viittausketju, jonka kautta löytää aina pykälää alemman
  aktivaatiotietueen. Pääohjelmassa tässä kohtaa on nolla eli
  "NULL-viite", mistä tiedetään että pinon pohja on löytynyt. Tämä on
  yksi konkreettinen esimerkki abstraktin "listamaisen" tietorakenteen
  toteutuksesta muistiosoitteilla, jotka niin sanotusti linkittävät
  mielivaltaisen kokoisia tietueita aina "seuraavaan" eli tässä
  tapauksessa aiemmin kutsutun aliohjelman aktivaatiotietueeseen.

- Monisteen sarjakuvassa on esitetty kutsuvaiheen
  operaatiot. Paluuvaiheen operaatiot on tehtävä käänteisessä
  järjestyksessä. Monisteen tekstissä nämä on kuvailtu, ja demo 5:n
  kohdalla nähdään debuggerin kautta konkreettinen toteutus AMD64:llä.

- Lisähuomautus: Aliohjelman kutsuminen ja sieltä palaaminen tulee
  tietenkin määritellä konekielen tasolla laitteisto- ja
  käyttöjärjestelmäkohtaisessa ABI-sopimuksessa (Application binary
  interface), jotta konekielelle käännetyn ohjelman on mahdollista
  käyttää konekielisiä jaettuja kirjastoja. Yhden ohjelman sisäisiä
  kutsuja saa kukin tietysti tehdä ihan miten haluaa, joten
  esimerkiksi koodin automaattinen optimointi saattaa tehdä aivan
  kummallisen näköisiä kutsuja, joita on hankala ymmärtää ja
  debuggailla disassemblyn perusteella. Kääntäjän vivut "-g -O0"
  tekevät ymmärrettävämpää jälkeä. Demossa 5 esimerkkikoodissa on
  ylimääräinen aliohjelmakutsu, joka ei tee mitään muuta hyödyllistä
  kuin estää kääntäjää optimoimasta liikaa.

Demo 5:n olennainen sisältö, eli aliohjelma-aktivaatio ja konekielinen
ohjelman suoritus:

- Ohjelman jälki (engl. "trace"; mm. Stallingsin kirjan terminologiaan
  vedoten) eli varsinaisten suoritettujen käskyjen ketju. Tietyssä
  muistipaikassa oleva konekielikäsky voi sisältyä jälkeen useita
  kertoja (toistuvat silmukat, useasti kutsutut
  aliohjelmat). Toisaalta tietty konekielikäsky ei sisälly jälkeen
  lainkaan (esim. tiettyä aliohjelmaa ei tarvitse kutsua tai tietty
  ehto ei koskaan täyty jossakin ehtolauseessa).

- Reunahuomautus: Kaikkein tiukimmat laadunvarmistusmenettelyt
  vaativat muiden seikkojen ohella, että testien koodikattavuus eli
  "code coverage" on 100%. Tämä tarkoittaa, että testiohjelman jäljen
  tulee kulkea jokaisen konekielisen käskyn läpi vähintään kerran. Eli
  testikeisseissä on oltava oikeita ja vääriä syötteitä sekä
  simuloituja toimintahäiriöitä niin paljon, että kaikki if-then-else
  -vaihtoehdot ja catch-lohkot käydään testin aikana läpi. Tämä on
  kallista puuhaa, joten 100% koodikattavuus on järjetön muiden kuin
  potentiaalisesti ihmishenkeä uhkaavien ohjelmistojen testaamisessa
  (mm. siviililentokoneiden ohjaus, tietyt lääketieteelliset
  instrumentit).

About tässä kohtaa tapahtui vappu (ja söi yhden maanantailuentoajan).

** Luento 12: Konekieli, rekursio, aikakatkaisu/keskeytys, Historiakatsaus

Millainen sää luentosalin ja Agoran ulkopuolella vallitsee tällä
hetkellä?  Komennetaanpa shellissä:

curl wttr.in/Jyvaskyla

Mitäs? Joku on tehnyt hauskan palvelun, josta opiskelija vinkkasi
irkissä vuonna 2016. cURL on POSIXin määrittämä [EIKÄ ole POSIXin
määrittämä, mistä lie joskus tullut opettajalle moinen aivotuhnu?
Yleisesti käytetty ja alustariippumaton se toki on] apuohjelma, joka
noutaa Internetin yli URLin mukaisen vastauksen palvelimelta ja ohjaa
sen standardiulostuloon... "man curl" kertoo lisää. Tämä on
standardimpi tapa yksittäisiin WWW-palvelinkyselyihin kuin
mm. demo-ohjeissamme käytetty "GNU Wget". Kapeaan terminaali-ikkunaan
ei välttämättä mahdu koko tuloste, joten luentosalissa seuraava voi
olla parempi komento:

curl wttr.in/Jyvaskyla 2>/dev/null | head -7

Tämä komento putkittaa curl'in tulosteen head'ille, jonka avulla voi
tulostaa vain argumenttina annetun määrän ensimmäisiä riviä. Nyt curl
voi joutua lopettamaan tulostuksensa kesken, kun head ei haluakaan
enää lisää syötettä. Curl toteaa tämän virheilmoituksena
standardivirhevirtaan, josta ei tässä komennossa olla kiinnostuneita,
joten virhetulosteet ohjataan operaattorilla '2>' kankkulan kaivoon
eli /dev/null'iin johon ohjatuilla tavuilla ei tehdä mitään.


Asiaan.


Demo 5:n juttuja:

- Aliohjelmakutsu siten kuin demo 5:ssä käsitellään.

- Rekursio (Kokonaisluvun kertoma rekursiivisesti): saman aliohjelman
  aktivaatiot päällekkäin pinossa.

- Jälki, laitekeskeytykset ja reaaliaika: Nykyjärjestelmissä
  sovellusohjelma ei tiedä, mitä kahden konekielikäskyn välissä
  tapahtuu ja kauanko siinä kestää. Käyttöjärjestelmän koodi voi estää
  estää tai sallia uudet keskeytykset, joten "atomisen toimenpiteen"
  toteutuminen sovellusohjelmassa edellyttää käyttöjärjestelmäkutsun
  tekemistä.


Ja sitten:

Katsaus tietokoneiden ja käyttöjärjestelmien symbioottiseen
historiaan. Jotta voidaan katsoa nykypäivästä eteenpäin, täytyy
tietää, mistä tähän ollaan tultu ja miten!

Ensimmäiset tietokoneet 1940-1950 -luvuilla eivät moniajoa
mahdollistaneet, mutta siitä se kehitys sitten havaittujen ongelmien
ja ratkaisujen kautta lähti... ensimmäisenä ohjelmointikielten ja
kääntäjien rakentelulla, suojatun tilan ja käyttöjärjestelmätilan
toteuttamisella prosessorin ominaisuutena sekä keskeytysten,
mm. aikakatkaisun löytymisestä prosessorin piirteenä, joka keskeyttää
sovelluskoodin ja siirtää prosessorin käyttöjärjestelmätilaan aina,
kun laitteistossa tapahtuu jotakin uutta.

Lähes 70-vuotisen historiikin kautta perusteltakoon tarpeet
vuorontamiseen, moniajoon, muistin ja muiden laiteresurssien
hallintaan sekä muihin toimenpiteisiin, joihin käyttöjärjestelmää
nykypäivänä tarvitaan. Merkkipaaluja tietokoneiden ja
käyttöjärjestelmien kehityksessä vuosien varrella. Kehitys
nykymuotoisia käsitteitä ja toimintamalleja kohti tapahtui erityisesti
1960-luvun aikana:

- hukka-ajan poisto: keskeytykset, I/O:n odotus ja aikakatkaisu

- Prosessorin täytyy voida toimia ainakin kahdessa eri tilassa:
  suojatussa ja rajoitetussa (tietyt muistiosoitteet ja
  I/O-toimenpiteet kiellettyjä) käyttäjän tilassa ja
  rajoittamattomassa käyttöjärjestelmän tilassa; tilojen välinen
  siirtymä täytyy olla mahdollista - erityisesti meneillään olevan
  suorituksen keskeyttäminen esimerkiksi aikakatkaisuna täytyy olla
  mahdollista. Myös käyttäjtilan ohjelmalla täytyy olla mahdollisuus
  pyytää siirtymää käyttöjärjestelmän palveluun ("system call")
  jolloin prosessorin tilan on vaihduttava.

Ihan pari historiallista artikkelia:

- lokaalisuusperiaatteen historiaa lähdemateriaalista vilkuillen
  (kirjallisuusviite kiinnostuneille, lisämateriaalia, ei pakollinen:
  http://denninginstitute.com/pjd/PUBS/CACMcols/cacmJul05.pdf
  ... edistyneenä osaamistavoitteena on oppia löytämään ja lukemaan
  tieteellisiä artikkeleita vuosien varrelta)

- katsottakoon läpi myös alkuperäinen UNIXin, C-kielen ja putkitusta
  tukevan shellin uutuuksia hehkuttava artikkeli "The UNIX
  time-sharing system" vuodelta 1974.

** Luento 13: Prosessi, säie.

Sitten periaatteessa luentomonisteen järjestyksessä etteenpäin...

Yhteenveto käyttöjärjestelmän tehtävistä, tavoitemittareista ja
kompromisseista.

Esim. vuoron vaihto prosessien välillä sisältää hukka-aikaa:

  P1 |------|              |------|
  P2            |------|
  kj        |---|      |---|      |---|

Tiheämpi kellokeskeytys:

  P1 |---|           |---|
  P2         |---|           |---|
  kj     |---|   |---|   |---|


Prosessorin suoritussykli, tarkempi kuva:

- käskyn ja operandien nouto, suoritus, tulosten tallentaminen JA
  mahdollinen ohjelman itsensä aiheuttama (syscall-pyynnöllä tai
  laittoman/mahdottoman käskyn seurauksena) tai ulkopuolelta tuleva
  keskeytys. Keskeytys on mahdollinen minkä tahansa käskyn jälkeen,
  jos sen aiheuttaa ulkopuolinen, kontrolloimaton, lähde. Käytännössä
  ainoa koodi, joka voi tapahtua ilman keskeytyksiä, on alkupuoli
  käyttöjärjestelmän keskeytyskäsittelijästä - kunnes kyseinen koodi
  itse sallii uudet keskeytykset. Luentomoniste kertoo hieman lisää
  yksityiskohtia.

- "FLIH", eli mitä keskeytyksen tullessa tapahtuu prosessorissa ennen
  seuraavan käskyn noutoa.
Kysymys "Blue screen" (win), "kernel panic" (linux)
tulosteista.. kyseessä käyttöjärjestelmän virhe, josta ei ole
paluuta. kyllä näissä virheilmoituksissa nimenomaan viitataan
käyttöjärjestelmän muistialueisiin (koodiosoite RIP, kernel stack
pino-osoite RSP)


Moniajo, prosessi, "säie", resurssit, haaroitus ja käynnistys.

Prosessi? Kertausta aiemmista havainnoista:

- POSIXin Base Definitions -osion termimäärittely "Process":

  "An address space with one or more threads executing within that
  address space, and the required system resources for those threads."

  Vautsi... Pystytään jo ymmärtämään suurin osa tästä kuvailusta!
  Määrittelyssä tulee jo mukavasti esille "säie", mikä tarkoittaa yhtä
  ajan suhteen etenevää suorituskohtaa ohjelmassa. Prosessilla on
  POSIXinkin mukaan aina vähintään yksi "säie", joka alkaa ohjelman
  alusta ja päättyy ohjelman loppuessa. Säie muodostaa yhden
  konekielisen jäljen, eli peräkkäin suoritettujen käskyjen
  sarjan. Tässä päästään jo pakosti uumoilemaan seuraavaa asiaa, eli
  että prosessilla voi olla yhden sijasta useampia
  säikeitä. Lisähuomio POSIXin termimäärittelyssä:

  "Many of the system resources defined by POSIX.1-2008 are shared
  among all of the threads within a process. These include the process
  ID, the parent process ID, process group ID, session membership,
  real, effective, and saved set-user-ID, real, effective, and saved
  set-group-ID, supplementary group IDs, current working directory,
  root directory, file mode creation mask, and file descriptors."

- Prosessilla on vanhempi, mahdollisesti myös lapsia ja sisaruksia -
  riippuen mikä prosessi on pyytänyt luomaan uusia. Sillä on
  identiteetti (vähintään ID-numero) sekä käynnistävän käyttäjän ja
  ryhmän identiteetit (vähintään ID-numerot). Lisäksi sillä on oma
  muistiavaruus, joka sisältää koodi-, data-, pino- ja kekoalueen sekä
  dynaamisten kirjastojen koodialueita. Nykyisin myös
  käyttöjärjestelmän tarvitsemat alueet on liitetty jokaisen prosessin
  virtuaalimuistiavaruuteen käyttöjärjestelmäkutsujen tehostamiseksi.

Mitä muuta liittyy prosessiin?

- resurssin käsite: laitteiston osat, tiedostot ja yhteydet,
  mukaanlukien prosessorin käyttöaika ja rajallinen keskusmuisti, ovat
  resursseja, joita käyttöjärjestelmä allokoi prosessien käyttöön
  niiden pyynnöstä; aiemmin mainittujen lisäksi näihinkin tietoihin on
  päästävä käsiksi prosessikohtaisten tietojen kautta. (Näkökulma
  käyttöjärjestelmään resurssimanagerina).

- Prosessit käyttöjärjestelmän tietorakenteena: prosessielementti
  ("Process Control Block", PCB) ja prosessitaulu ("process table" /
  "process array") tai prosessilista (kuten Linux-toteutuksessa on).

- Linuxin task_struct -tietorakenne, eli noin 450 koodiriviä
  (versiossa 4.4) määritelmiä siitä, mitä tietoja yhteen prosessiin
  kuuluu. Kiinteä linkki version 4.4 lähdekoodiin:
  http://lxr.free-electrons.com/source/include/linux/sched.h?v=4.4#L1378

  Havaintoja: osa on kokonaislukuja, mutta suuri osa on osoittimia
  laajempiin tietorakenteisiin, joille on varattu muistia jostain
  toisesta kohtaa muistia. Suuri osa myös riippuu
  konfigurointivaiheessa valituista ominaisuuksista (#ifdef
  CONFIG_JOKIN_OMINAISUUS_MUKANA ... #endif).

  Tämä ``task_struct`` on normaali C-kielen tietorakenne, jonka
  sisäiset kentät ovat muistissa tallessa peräkkäisessä
  järjestyksessä. Huomaa mm. rakenteen määrittelyn lopussa oleva
  kommentti, joka muistuttaa, että x86-koneiden osalta nykyisellään
  viimeiseksi kirjoitetun kentän on todellakin oltava viimeinen, eikä
  sen jälkeen saa lisätä mitään muuta.

  Liukulukuja ei käyttöjärjestelmäkoodissa juurikaan ole. Esim. ajat
  mitataan kokonaisina nanosekunteina eikä osittaisina sekunteina tai
  muuta, mikä edellyttäisi muita kuin kokonaislukuja.

** Luento 14: Fork(), exec(), shellin perustoiminta, tilakaavio. IPC: signaalit

Hmm... meillähän loppuu periodi ensi viikolla.. Mitä tämä tarkoittaa?

- Katsotaan, mihin asti ehditään. Hyvä puoli on, että nyt on jälleen
  käyty pohjia vähän perinpohjaisemmin tähän asti.

- Joka tapauksessa demo6 määritellään nyt täysin
  vapaaehtoiseksi. Keskitytään demo1-demo5 -osastoon kunnolla!

- loppukiri! Ohjauksia "koodaamo"-tyyppisesti:

  pe 12.5.2017 12:15-15:00 Ag B112.2 (Latin)
  ti 16.5.2017 12:15-15:45 Ag B112.1 (Africa)
  to 18.5.2017 12:15-15:45 Ag B112.2 (Latin)

- eka tenttipäivä pe 19.5.2017 ("mallitentti" 144 tuntia ennen, so lauantaina)

Jatketaan suoraan prosessin olemuksesta:

- Prosessin luonti haaroittamalla eli kloonaamalla vanhempiprosessi
  (unix-pohjaisen käyttöjärjestelmän tapa luoda uusia prosesseja):

  Esimerkkinä ihan itse käännetty minimalistinen shell, joka odottaa
  komentoriviä ja osaa käynnistää käyttäjän pyytämän ohjelman.

  [ Tällä kurssilla tutkitaan unixmaista tapaa luoda prosesseja; jos
    Windows-maailman variaatio sattuu kiinnostamaan,
    käyttöjärjestelmäkutsun CreateProcess() rajapinta löytyy tuolta:
    https://msdn.microsoft.com/en-us/library/windows/desktop/ms682425%28v=vs.85%29.aspx
  ]

Prosessielementin kloonaus fork():illa ja korvaaminen ladattavan
ohjelman tiedoilla exec():issä vaatii "maistelua", miettimistä ja
parin unen näkemistä.

- Prosessin tilat ja tilasiirtymät, tilakaavio.

- Vuorontaja ja vuorottelu: prosessoriajan jakaminen. "Kiertojono" eli
  Round Robin. Odottelujonot blokatuille prosesseille.

- Kontekstin vaihto laitteiston ja käyttöjärjestelmän
  yhteistoimintana.

  Koko kontekstin vaihtaminen (kaikki rekisterit + muistikartta)
  vaatii aikaa, joka on pois hyötylaskennasta - optimointina
  esim. pidemmät aikaikkunat ja modernien prosessorien "kevyet
  vaihdot". Harvemmat vaihdot prosessien välillä -> isompi
  "throughput". Pakollisena kompromissina tulee pidemmät vasteajat tai
  huonompi tasapuolisuus.


Prosessien (ja säikeiden) välinen kommunikointi eli IPC:

- engl. Inter-process communication. Yksi tärkeistä tehtävistä, joihin
  käyttöjärjestelmää tarvitaan. Esimerkkejä:

  + signaalin lähettäminen pääteyhteyden näppäilyllä "päällimmäiselle"
    ohjelmalle, jolle syötteet ohjautuvat.

  + signaalin lähettäminen kill -komennolla shellistä. Signaalien
    listaaminen. Esimerkkisovellus: dd -apuohjelman tilannetiedon
    kysyminen (ei toiminut luennolla jostain toistaiseksi
    tuntemattomasta syystä; manuaali lupaa, että dd:n pitäisi osata
    napata SIGUSR1 - kumma juttu.. selvitellään..)

** Luento 15: Säikeet. Kilpa-ajo, lukot, deadlock. Semafori. Muistinhallinta.

Tästä jatketaan viimeinen viikko tiukasti siihen asti kuin vaan
ehditään:

  + yksi erilainen IPC-tapa, viestijono (message queue): 

    koodi 2017/esimerkit/l16/ -hakemistossa: chattomyself.c

    (tässä oli "demoefekti" luennolla 15.. todellinen efekti siis se,
    että luennoitsija luuli varoitusta virheeksi ja ettei koodi
    kääntynyt.. vaikka se kääntyikin. Esimerkistä korjattu nyt myös
    varoitukset pois.)


Säie vs. prosessi: 

- Säie on yksi ajassa etenevä suorituskohta prosessin koodissa, joka
  muodostaa konekielisten suoritusten "jäljen" ja vaikutuksia dataan.

- Prosessilla voidaan aina ajatella olevan vähintään yksi
  säie. (ks. esim. POSIXin Base definitions -luvun määritelmä termille
  "Process")

- Jos alusta (ts. käyttöjärjestelmä ja apukirjasto) tukee useampia
  yhdenaikaisia säikeitä, niitä voi luoda prosessille tarpeen mukaan,
  esim. POSIXin säielaajennoksen kutsulla
  pthread_create(). Lähdekoodissa säie ilmenee aliohjelmana, jonka
  päättymistä voi jäädä odottelemaan esim. POSIXin kutsulla
  pthread_join() tai säikeen voi jättää suorittamaan tehtäväänsä
  "taustalle" tarvittaessa vaikka koko prosessin päättymiseen saakka,
  tai niin pitkään kuin säikeen operaatio ylipäätään kestää.

- Suorituksen vuorottelun mielessä säie ja prosessi ovat hyvin
  samantyyppisiä käsitteitä: periaatteessa kaikki säikeiden avulla
  tehtävät asiat voitaisiin hoitaa myös luomalla prosesseja.

- Säie on kuitenkin yhden sovelluksen sisäisiin tarpeisiin paljon
  kevyempi konsepti: se tarvitsee olennaisesti vain prosessorin
  kontekstin, pinomuistin ja muut suorituskohtaan liittyvät tiedot -
  kaikki muu, mukaanlukien koodi, keko, globaali data, avatut
  tiedostot, ym. ovat yhteiset säikeen omistavan prosessin kanssa.

- mihin säikeitä voi käyttää? Esim. ohjelman sisäiset "tausta-ajot"
  (esimerkiksi videon toistaminen selaimen välilehdessä samalla kun
  käyttäjä voi klikkailla muita välilehtiä ilman; suurten tiedostojen
  lataamiset ja tallentamiset), seinäkelloajan minimointi
  rinnakkaislaskennalla.

- Laskentatehtävien nopeuttaminen säikeistämällä vaatii säikeiden
  suorittamista konkreettisesti yhtäaikaa rinnakkaisilla
  prosessoriytimillä. Yhdenaikainen tausta-ajo onnistuu tietysti
  yhdelläkin prosessorilla normaalin prosessien vuoronnusmenettelyn
  tapaan.

- esimerkki: taulukon täyttäminen peräkkäisillä luvuilla

  koodit 2017/esimerkit/l15/ -hakemistossa: saikeiden_tarve.c saikeet.c

- "kilpa-ajotilanne" eli race condition: vuoronnus voi milloin vain
  keskeyttää säikeen (tai prosessin) ja antaa suoritusvuoron toiselle:

  koodi 2017/esimerkit/l15/ -hakemistossa: race.c

- lukitus auttaa: keskinäinen poissulku race_fixed_mutex.c
- deadlock -tilanne, esimerkki huolimattomasta resurssilukituksesta:
  huonon kahvihuoneen simulaattori kahvihuone_deadlock.c ja toimivamman
  kahvihuone_ei_lukkiudu.c

Semafori maininnan ja esimerkin tasolla (ei tenttiin 2017):

- esimerkki: tuottaja-kuluttaja -probleemi sekä sen ratkaisu kolmella
  semaforilla

  koodi repossa: 2017/esimerkit/l15/tuottaja_kuluttaja.c

  "ASCII-sarjakuva" repossa: 2017/esimerkit/l15/tuott_kulutt_rengaspuskuri.txt

  Vaatii omakohtaista miettimistä! Tämäkin esimerkki on tarkoituksella
  yliyksinkertainen, vaikka siinä onkin mukana olennaiset osuudet:
  semaforien alkuarvojen asettaminen ja oikeellinen järjestys
  semaforikutsuille. Osaamistavoite on ymmärtää, mikä on semafori ja
  miten rengaspuskuria käyttävä tuottaja-kuluttaja toteutetaan
  semaforilla.

- Pienoishuomioita prosessien/säikeiden synkronoinnista:

    + Onnistuu semaforeja vastaavalla "vahvuudella" mm. myös
      viestinvälityskutsuilla ja ns. "monitoreilla"; kauan sitten
      tutkittu, todettu ja julkaistu asia.

    + Nykyisissä oliokielissä helppoa: Javassa heitetään avainsana
      "synchronized" kentälle ja C#:ssa ilmeisesti (tsekattu lyhyesti
      nettifoorumeilta) tyyliin
      "[MethodImpl(MethodImplOptions.Synchronized)]" tai "lock {
      /*lukituksen tarvitsevaa koodia tässä*/ }".)

    + Deadlock ja muut ongelmat aina mahdollisia myös uudemmissa
      oliokielissä! Varovasti aina! Yhdenaikaisuus vaatii erityistä
      tarkkuutta suunnittelussa.

    + Synkronointia ei pidä käyttää, jos ei sitä tarvita! Miksi? Tulee
      älyttömästi hukka-aikaa lukituksia hoitavista
      käyttöjärjestelmäkutsuista!! Mutta pitää tunnistaa kohdat,
      joissa välttämättä tarvitaan. Erityisesti täytyy tietää aivan
      yksittäisen muuttujan tasolla, onko se mahdollisesti jaettu
      usean säikeen kesken. Tarkkana suunnittelussa ja toteutuksessa!

    + Säikeitä kannattaa alkaa käyttämään omissa ohjelmissa tarpeen
      mukaan, muistaen tarkkaavaisuuden ja potentiaaliset
      ongelmatilanteet!


Ensihavaintoja muistinhallinnasta.

** Luento 16: Virtuaalimuisti, sivutaulut, heittovaihto. Unixin erikoistiedostot. I/O.

Loppusuoralle / lopputaisteluun... Niin monta tuntia aikaa ekaan
tenttiin, että kyllä me siihenkin mennessä vielä paljon hyviä asioita
ehditään oppia.

Esitetty toive, että mallitenttiä käytäisiin läpi. Muistuttakaa noin
puolessavälissä luentoa!!

Muistinhallinta:

- tavoitteet: 

  + maksimaalinen kapasiteetti, riittävä nopeus. Perusidea: pidetään
    tällä hetkellä käyttämättömät tiedot hitaassa mutta isossa
    muistissa, tuodaan tarvittaessa lähemmäs. Eli hyödynnetään
    lokaalisuusperiaate -havaintoa.

  + suojaus, eri oikeudet eri muistialueilla. Looginen eriytys
    segmentteihin: koodi, data, pino, keko (dynaamiset oliot)

- käytettävissä: muistihierarkian mukaiset muistit, prosessori, MMU

Sivuttava virtuaalimuisti:

- sivutus

- osoitteen tulkinta, osoitteenmuunnos virtuaalisesta fyysiseksi

- prosessorin sivutaulu: sisältää fyysisen sivukehyksen indeksin sekä
  yksittäisinä bitteinä sivukohtaiset suojaus- käyttöhistoriatiedot ja
  tiedon, onko sivu muistissa vai kovalevyllä.

- heittovaihto (swap), working set:

    + Siinä missä laitteisto hoitaa prosessorin sisäiset välimuistit,
      käyttöjärjestelmä pystyy ottamaan vastaavalla periaatteella
      avuksi myös käytännössä rajattoman kokoiset massamuistit.

    + prosessorissa on ominaisuudet (sivutaulun automaattisesti
      päivittyvät bitit), joilla heittovaihto on mahdollista toteuttaa.

- sivuvirhe (page fault) / sivunvaihtokeskeytys ja sen käsittelijä

- käyttöjärjestelmän tietorakenteet: prosessikohtaiset sivutaulut ja
  kehystaulu.

- Korvausalgoritmi, esim. least-recently-used
  (LRU). Käyttöjärjestelmän operaatiot "swap out" ja "swap in"
  -vaiheissa.


Välimuistin ruuhkautuminen eli "cache trashing" tarkoittaa välimuistin
ulkopuolisen väylän tai pahimmillaan heittovaihdon suhteellisesti
tiuhempaa käyttöä, joka tuhoaa suorituskyvyn - välimuistien osaltakin
dramaattisesti, mutta heittovaihdon osalta jopa rampauttavasti).

- Esimerkki: (jälleen simppeli "koeputkiesimerkki", jotta perusilmiö
  näkyisi mahdollisimman hyvin):

    koodi repossa: 2017/esimerkit/l16/cache.c

- Miten tällaisilta vältytään?
  
    + Suunnitellaan algoritmit suoraviivaisiksi ja mahdollisimman
      vähän operaatioita vaativiksi aivan normaaliin tapaan; lisäksi
      selvitetään, millä tavoin alla oleva alusta käyttää muistia,
      eikä tehdä "luonnonvastaista" koodia.

    + Yhdenaikaisten prosessien/säikeiden ja putkien käyttö
      mahdollistaa peräkkäisten dataoperaatioiden rakentelun
      modulaarisesti (operaatiot vaihdeltavissa keskenään; peräkkäiset
      operaatiot tapahtuvat yhdenaikaisesti, kun data on vielä
      edeltävän operaation jälkeen lähemmässä muistikomponentissa)

    + (ja niin edelleen. Lisää jatkokursseilla, joissa puhutaan
      enemmän ohjelmistojen ja järjestelmien suunnittelusta.)

Esimerkki muistin kartoituksesta ja muiden kuin tavallisten
tiedostojen ilmenemisestä tiedoston näköisinä, normaalissa
hakemistopuussa, unixmaisessa käyttöjärjestelmässä; aasinsilta
tiedostojärjestelmiin:

  - Esim. prosessin 1234 muistikartan saa Linuxissa nähtäville
    tulostamalla erikoistiedoston nimeltä /proc/1234/smaps

  - Katsotaan jotain oikean ohjelman karttaa,
    esim. emacs-tekstieditorin. Havaitaan mm. lukuisa joukko
    kirjastoja, joiden tarvitsee olla ladattuna fyysiseen muistiin
    vain yhtenä kopiona, vaikka emacs olisi käynnissä vaikka kuinka
    monena prosessina.

Pari lisäesimerkkiä Unix-tyyppisestä "kaikki ilmenee tiedostona" -lähestymisestä:

    + /dev/urandom -"tiedostosta" voi lukea loputtomiin satunnaislukuja

    + /dev/sda vastaa ensimmäisen koneeseen liitetyn fyysisen
      kovalevyn tavuja ilman tiedostorakennetta; voi käyttää
      esim. täydellisen varmuuskopion tekemiseen tai
      palauttamiseen. Tietenkin käyttö on sallittu vain ylläpitäjän
      oikeuksilla. Kopiointi myös edellyttää järjestelmän
      käynnistämistä esim. muistitikulta siten, että kovalevy ei ole
      kopioinnin aikana kytketty tiedostoineen.

    + Hakemiston /dev/ listaaminen näyttää monia muitakin
      tiedostonimiä, jotka itse asiassa vastaavat fyysisiä
      I/O-laitteita. Useimmat ovat saatavissa vain
      järjestelmänvalvojan oikeuksilla, ja niitä on tarkoitus käyttää
      sovelluksissa käyttöjärjestelmäkutsujen kautta sen sijaan että
      suoraan esim. päätteeltä.

    + /dev/sda -"tiedostosta" voi lukea (käyttöoikeuksien salliessa)
      kovalevyn koko sisällön bitti bitiltä esimerkiksi koko
      järjestelmän kattavaa varmuuskopiointia varten.

Lisää tiedostonhallinnan käyttäjänäkökulmaa:

Esimerkki:

  - Tiedostojen käyttöoikeudet rwx / ugo. Shell-ohjelma
    chmod nähty jo aiemmin.

    (HUOM: yliopistomme verkkolevyt eivät sisäisesti tue POSIXin
    käyttöoikeusmääritelmiä; omat kokeilut kannattaa tehdä siis
    esim. itka203-testi.it.jyu.fi -palvelimella, joka ei muutenkaan
    ole kytketty verkkolevyyn, tai sitten jalavan tai halavan /tmp
    -hakemistossa. Viimeksi mainitusta siivoa lopuksi
    kokeilutiedostosi pois, etteivät jää muiden vaivoiksi
    yhteiskäyttöiseen järjestelmään... kyllä /tmp kuulemma kait myös
    siivotaan aika ajoin myös jonkinlaisella automaattivälineellä...)

I/O ja Tiedostonhallinta käyttöjärjestelmätoteutuksessa:

- Tavoitteita: datan organisointi, osoitteistaminen, puumainen
  hierarkia ("kansiot"). [kyseessä on todellisuudessa pikemminkin
  suunnattu graafi eikä puu, koska hakemistoista voi olla ns. linkkejä
  muihin hakemistoihin ja muissa hakemistoissa sijaitseviin
  tiedostoihin. Puu on kuitenkin ehkä hyvä ensimmäinen analogia.]

- Käytettävissä olevat laitteet: prosessori, I/O -portit, laitteiden
  aiheuttamat keskeytykset; rajapinnan takana hyvin erilaisia
  laitteita

- I/O -ohjelmiston kerrosmainen rakenne: laiteriippumaton osuus,
  laiteriippuva osuus (ajurit).

- I/O -kutsun kulku ohjelmistokerrosten läpi (karkea yleiskuva).


* Ja se oli sitten siinä vuodelta 2017! 

Tähän ehdittiin 2017. Loput ei tule tenttiin.

Vuoden 2017 mukaista kurssia voi suorittaa helmikuuhun 2018
saakka. Virallisten tenttikertojen (3 kpl) jälkeen kysy erillistä
tenttimahdollisuutta.

Vuonna 2018 kurssi rakentuu uusiksi eri näköisenä ja 5 op laajuisena,
joten kannattaa vääntää tämä nyt läpi, jos on tullut käyttyä jo paljon
energiaa. Aiempaa kurssia ei tarvitse erikseen laajentaa, mutta
syventävillä jatkokursseilla (esim. Kääntäjätekniikka,
Ohjelmistoturvallisuus, mahdollisesti tietyt IoT -kurssit on syytä
varautua täydentämään tietämystä erityisesti konekieliohjelmoinnin
osalta.)


* 2017 pois jätettyä:

Semaforin käyttö kuluttaja-tuottaja -ongelman ratkaisussa. (Semafori
tietorakenteena käytiin läpi, ja se on muistettava, ts. resurssien
määrää kuvaava kokonaisluku ja jono/joukko prosesseja, jotka
jonottavat siinä tapauksessa, että vapaana on 0 kpl resurssia).

TODO: Hyvä tietää -osastolle 2017:

*** Tiedostonhallinnan sovellusnäkökulma:

Esimerkki:

  - Tiedostojen käyttöä POSIX-käyttöjärjestelmäkutsuilla ja C:n
    alustakirjaston kutsuilla; tiedoston avaaminen ja luominen,
    kirjoittaminen, sulkeminen. Käyttöoikeuksien asettaminen.

    koodi repossa: 2017/esimerkit/l17/hellofile.c

Esimerkki:

  - Oman "cat -apuohjelman" raakile; tiedoston avaaminen, lukeminen ja
    kirjoittaminen tavu kerrallaan, sulkeminen C:n alustakirjaston
    kutsuilla.

    koodi repossa: 2017/esimerkit/l17/liit.c

Aasinsilta kohti tiedostonhallintaa ja tiedostojärjestelmiä muuttuu
oikeaksi sillaksi, kun käsitellään välissä vielä I/O -laitteiston
piirteitä, esimerkkinä kovalevy, joka soveltuu tiedon pitkäaikaiseen
säilyttämiseen tiedostoihin ja hakemistoihin organisoituna.

*** Lisää esimerkkejä erikoistiedostoista /dev/ -hakemistossa

Luennoilla on aiemmin nähty esimerkkejä muistakin erikoistiedostoista,
esim. /dev/urandom -tiedoston lukeminen saa käyttöjärjestelmän
generoimaan satunnaislukuja. Tiedostoon /dev/null voivat kaikki
käyttäjät "kirjoittaa", mutta siihen ohjattu data ei mene mihinkään,
vaan erikoistiedosto "nielee" tavut. Muita vastaavia, joita
unixmaisista usein löytyy:

    + /dev/random yrittää tuottaa "aitoa satunnaisuutta"
      tarkkailemalla ulkopuolisesta ympäristöstä riippuvia tekijöitä,
      kuten nettiyhteyksiä. *Älä käytä turhaan yhteiskäyttökoneella*,
      koska generointi hidastuu kaikkien tarvitsijoiden
      osalta. Ulkoisia ilmiöitä tapahtuu harvakseltaan "uskottavan
      satunnaisuuden" aikaansaamiseksi. Normaalitarpeisiin lue
      /dev/urandom -tiedostoa ("u"=="unlimited"), joka toimii kuten
      C:n rand()-funktio. Tiukempiin kryptografiatarpeisiin tällainen
      pseudosatunnaisuus ei ole välttämättä riittävä.

    + /dev/zero tuottaa loputtomiin nollatavuja luettavaksi.

    + /dev/tty on jopa POSIXin määräämä. Se toimii erikseen jokaiselle
      prosessille, ja sitä tulee voida käyttää syöttöihin ja
      tulostuksiin samoin kuin päätettä


*** Tiedostojärjestelmien toteutuksesta fyysiseen massamuistiin:
- kovalevyn rakenne

- lohkot muistissa ja levyllä; lohkot yleensä isompia kuin levyn
  sektorit

- käyttöjärjestelmän yleiset tavoitteet (läpivienti, tasapuolisuus,
  vasteajat jne.) voimassa myös I/O:n osalta. Lisäksi saatavuus- ja
  säilyvyyskysymykset; vikasietoisuus.

- käytännön penkaisua shellin kautta: 

    + komennot ``df`` (POSIX) ja ``mount`` (ei POSIX), ``du`` (POSIX).

      reunahuomio: Mistä tietää, mikä on POSIXia ja mikä ei? Tietysti
      standardin tekstistä. Komento joko on siellä tai ei. Tietyn
      tiedostojärjestelmän toiminta ei ole standardin vaan kunkin
      käyttöjärjestelmän omien laajennosten varassa. Unixmaisissa
      tiedostojärjestelmän kiinnittäminen hakemistopuuhun tapahtuu
      kuitenkin usein mount() -järjestelmäkutsulla ja shellissä mount
      -apuohjelmalla. Irrottaminen umount() -järjestelmäkutsulla ja
      umount -apuohjelmalla. POSIX vetää siis määrittelynsä rajan
      selvästi laiteriippumattoman ohjelmiston ominaisuuksiin
      (ts. tiedostojärjestelmän ja massamuistien olemassaolo,
      osoitteistaminen).

    + inode / POSIXin "sarjanumero" : komennot ``ls -i`` (POSIX) ja
      ``stat`` (ei POSIX).

- esimerkki: vanhan unixin tiedostojärjestelmän toteutuksesta
  yleiskuva, inodet ja levylohkot, isot tiedostot hierarkkisena
  lohkolistana

- journalointi: kirjataan ensin ylös, mitä levylle aiotaan kirjoittaa;
  sähkökatkon sattuessa menetetään vain meneillään olleen kirjoituksen
  tiedot, mutta tiedostojärjestelmän rakenne ei muilta osin
  korruptoidu, koska kesken jäänyt kirjoitustransaktio voidaan
  peruuttaa seuraavan käynnistyksen yhteydessä.

- levyoperaatioiden vuorontaminen on oma haasteensa. Internetin
  ihmeellinen maailma kertoo meille paljon hakusanalla "disk
  scheduling" (tieteelliset artikkelitietokannat kertovat tietysti
  uusimpia tutkimustuloksia yleistiedon lisäksi)

  Havainto: myös laitteita on vuoronnettava! Magneettisen kovalevyn
  vuorontaminen on sidoksissa fyysisen laitteen ominaisuuksiin
  (pyöriminen, lukupään sijainti) ja tiedostojärjestelmän
  organisointiin levyn pinnassa.


*** Lisäesimerkki -- kurssin mielessä kokonaisuudessaan liian syvällinen:

    Kurssin opiskelijan harrastusprojekti: muinoisen rinnakkaisportin
    keskeytyskäsittely.

    - Tietoja portista: http://retired.beyondlogic.org/spp/parallel.htm

    Tässäpä olikin hieno testi luennoitsijan omalle
    tiedonhakukyvylle :). En voinut käyttää tähän kovin paljon aikaa,
    mutta tässä ensimmäiset, ei välttämättä aivan oikeaan osuvat,
    tulkintani:

    - Jos ymmärsin oikein, laitteelle täytyy lähettää merkki,
      ikäänkuin se olisi "printteri" (mitä se ei tässä tapauksessa
      kuitenkaan ole:)). Sitten täytyisi tallentaa aikaleima hetkellä,
      jolloin "ikäänkuin printteri" ilmoittaa keskeytyksellä, että se
      on "tulostanut" edellisen merkin ja on valmis vastaanottamaan
      lisää. Fyysisen laitteen luonteesta johtuen ei voi ennalta
      tietää, millaisen ajan päästä tämä keskeytys tulee.
    - Ensimmäisellä googletuksella tuli vastaan tällainen softa:
      http://parapin.sourceforge.net/

    - Tämä Parapin on ilmeisesti tehty Linuxin versiolle 2.6, jota ei
      pahemmin tueta enää 2016. Ytimen rakenteessa voi olla tapahtunut
      muutoksia, jotka edellyttäisivät softan porttaamista uuteen
      versioon.

    Seuraava perustuu ajatukseen, että Parapin tai vastaava toimisi
    nykyisessä Linuxissa (tai käyttötarkoitus on sellainen, että
    laitetta hallinnoivaan koneeseen voisi tietoturvallisesti asentaa
    version 2.6).

    Ohjelmiston dokumentaatiossa ensinnäkin on linkki selkeästi hyvään
    johdantokirjallisuuteen:

    - Rubini & Corbet: "Linux Device Drivers":
      http://www.xml.com/ldd/chapter/book/ (ilmainen online)
      http://shop.oreilly.com/product/9781565922921.do (ostoversio)

    Jos esim. tuon Parapin-ohjelmiston ominaisuudet eivät riitä, niin
    kirjan perusteella saanee yleiskuvan siitä, miten Linuxin
    ajurijärjestelmä ja keskeytyskäsittelijät toimivat :), jotta voi
    modata esimerkin perusteella oman ajurin.

    Kyseinen Parapin -ohjelmahan on juurikin esimerkki
    rinnakkaisporttia käyttävästä ajurista. Siinä näyttäisi kyllä
    olevan lähes kaikki ominaisuudet, joita kysymyksen esittäjä
    tarvitsee harrastusprojektissaan.

    Parapinin voi äkkivilkaisun perusteella kääntää Linuxin ajuriksi,
    joka toimii yhteistyössä normaalin "parport" -ajurin
    kanssa. Keskeytyskäsittelijässä näyttäisi olevan callback-funktio,
    johon ilmeisesti voi ajurin ylösajon kohdalla saada oman
    C-aliohjelman ajettavaksi aina kun tietty rinnakkaisportti
    keskeyttää. Keskeytyksen kohdalla voisi *ehkä* tehdä jotain
    "quick-and-dirty" -tyyppistä, kuten::

      static void rakentele_aikaleima_jotenkin(char *buf){...}
      static laheta_porttiin_taas_uusi_operaatiopyynto_jotenkin(void *id){...};

      void oma_koukkufunktio(int irq, void *dev_id, struct pt_regs *regs){
	char[20] aikaleima;
	rakentele_aikaleima_jotenkin(aikaleima);
	printk(KERN_INFO "Laite sanoi tiks kellon ollessa %s\n", aikaleima);
	laheta_porttiin_taas_uusi_operaatiopyynto_jotenkin(dev_id);
      }

    Ja sitten, teoriassa, jos tällaisen saisi pyörimään, niin ytimen
    lokitiedosta voisi käydä ajoittain nappaamassa rivit, joilla lukee
    "Laite sanoi tiks", tyyliin shell-komento ``dmesg | grep "Laite
    sanoi tiks"`` ja jäsentää riveiltä aikaleimat.

    Tai sitten tuo oma käsittelijä voisi tehdä jotain
    hienompaa. "Oikea unixmainen ajuri" näyttäytyisi tietenkin
    loppukäyttäjälle tiedostona, esim. "/dev/munlaite/tilanne", josta
    käyttäjä voisi lukea tekstimuodossa aikaleimoista johdetut
    yhteenvetotiedot (jotka ovat käsittääkseni harrastusprojektin
    lopullinen käyttötarkoitus).

    Kevyellä tai raskaalla toteutuksella joka tapauksessa tuossa
    harrastuksessa joutuu lueskelemaan oppikirjallisuutta ja
    esimerkkikoodia, että saa homman pelittämään :). Hieno harrastus
    siis!! :)

    TODO: Heläytetään löytynyt oppikirja ehkä myös luentomonisteen
    lisälukemistolistaukseen.
*** Muita ohitettuja 2017


Esimerkki:

  - kahden eri ohjelman jakama muistialue
    POSIX-käyttöjärjestelmäkutsuja käyttäen; toinen aasinsilta
    tiedostojen käsittelyyn (jaettu muistialue näyttäytyy ohjelmalle
    ja muillekin tiedostona!)

    koodit repossa (+krediitit alkuperäiselle tekijälle):
    2016/esimerkit/l15/shm_msgclient.c
    2016/esimerkit/l15/shm_msgserver.c
    2016/esimerkit/l15/README_shm_example.txt

  - Todetaan esimerkissä oleva kilpa-ajotilanne (korjaamisen voi tehdä
    erittäin vapaaehtoisena, hieman vaativampana,
    harjoitustehtävänä...; sigesim.c:n malliin olisi syytä myös
    käsitellä TERM-signaali, jotta serveri osaa poistaa jaetun
    muistialueen loppuessaan lopetussignaalin
    johdosta. Oletuskäsittelijä ei voi tietää, että prosessi on
    pyytänyt yhteisen muistialueen.)

  - Katsotaan, että muistialue näkyy tiedostona hakemistossa /dev/shm
    ... POSIXin vaatima kauttaviivalla alkava nimi on vaan lisätty
    Linux-toteutuksessa /dev/shm:n perään.

  - Ja juu.. elä anna hakkerin tehdä tätä jaetulle muistillesi:

      echo Hei vaan hei | dd of=/dev/shm/foo1423 bs=1 seek=4 conv=notrunc

  - Telmitäänpä hetki tämän esimerkin ja tietoturvakysymysten äärellä,
    ja varmistutaan että Ohjelmistoturvallisuus ja
    Tietoverkkoturvallisuus ovat tarpeellisia jatkokursseja...

*** I/O:sta ja laitteista ohitettua 2017:

- DMA.

- RAID


*** Vuoronnusmenettelyjä, RT, skriptit.

Vuoden 2016 luennoilta 9-10:

Kerrataan tässä kohtaa yleisökysymys, joka viikko sitten tuli vasta
varsinaisen luentoajan jälkeen, videoinninkin loputtua. Tämä tulee
ihan pian tarkemmin, mutta otetaan silti jo alustava näkemys asiaan:

- muistihierarkian käytännön toiminta: laitteisto tosiaankin hoitaa;
  sovellukselle päin näkyy peräkkäisiä tavun eli 8 bitin mittaisia
  muistipaikkoja, joilla on omat, peräkkäiset osoitteensa. Vilkaistaan
  kurssin loppupuolelle (lukuun Muistinhallinta): AMD64:ssä on
  nelitasoinen hierarkinen "kartasto", jonka kautta konkreettinen
  osoitteentulkinta virtuaalisesta fyysiseksi tapahtuu.

  Idean tasolla meille riittää ajatella yksitasoista ns. sivutaulua,
  jollaisen osaaminen on yleensä ollut tenttikysymyksenäkin. Eli ikään
  kuin ajateltaisiin vain AMD64:n viimeistä taulukkotasoa, jonka nimi
  oikeassa manuaalissakin on "Page table". Idean tasolla riittää myös
  ajatella paljon lyhyempiä muistiosoitteita kuin esim. AMD64:ssä
  oikeasti on.

  Joka tapauksessa muistiosoitteen bittijonon alku ilmoittaa, mille
  sivulle osoitus kohdistuu, ja loppuosa, esim. 12 bittiä ilmoittaa
  tarkan osoitteen kyseisen sivun sisällä. Fyysinen muisti on jaettu
  sivukehyksiin.

  Sivutaulujen (ja tarvittaessa monitasoisten hakutaulukostojen)
  luonti on käyttöjärjestelmän muistinhallintaosion vastuulla. Se
  tekee sen prosessorin ja MMU:n manuaalin määrittelemillä
  keinoilla. Toki itse taulut ja "kartastot" ovat määrämuotoista
  dataa, joka sijaitsee tietokoneen muistissa (käyttöjärjestelmän
  hallitsemalla alueella), missä kaikki muukin. Esim. "AMD64 System
  Programmer's Reference" kertoo kaiken siitä, miten näitä tauluja
  käytetään.


* Vuoden 2015 toteumaa:

** Luento 17: Tarvittavat paikkaukset. Yhteenveto. Kertaus ja tärpit

Agendalla olisi:

*** Tomin terveisiä demoista:

  - demot 1, 2 ja 3 mennyt hyvin ja ohjeaikataulussa:

      + demosta 1 läpi 137, hylkykertoja 26, syy yleensä "oudot
        rivinvaihdot", jollaisia ei suoraviivaisesti ohjeiden mukaan
        toimimalla oikein pysty tulemaan..

      + demosta 2 läpi 117, hylkykertoja 17, syy yleensä jokin
        puuttuva tai erilainen tuloste kuin pyydettiin

      + demosta 3 läpi 108, hylkykertoja 4 (syy ympäristömuuttujan
        puuttuminen)

      + demosta 4 läpi 70, hylkykertoja 26 (yleensä useita ongelmia;
        pienillä on mennyt läpi, mutta vähintään merkin poistamisen)

        * ei-kääntyviä ohjelmia tänä vuonna vain 2.

        * varottava "1:llä ohi" virheitä.

        * yksinkertaisuus on hyve.

        * kynä ja paperi!

      + demosta 5 läpi 38, hylkykertoja 41 (pienillä mennyt läpi,
        ts. noin 2-3 ongelmakohtaa läpi, useampi -> ei vielä läpi)

        * selkeitä ongelmia ymmärryksessä on, jos esim. kuvittelee
          paikallisten muuttujien sijaitsevan koodialueella tai
          toisin päin.

        * suurin muistiosoite, joka on taulukolla käytössä?

        * bitit ja tavut sekaisin? "tavu==8 bittiä" Montako tavua
          varattu tilaa 6:lle 8-tavuiselle int:lle? Ei varmaan 6*8*8
          tavua!

        * kummallisiakin lukuja, joille Tomi ei keksinyt selitystä..

        * muistin olemuksesta ei vielä ole selkeää, yksinkertaista
          mielikuvamallia.

        * Missä muuttujan "samoja" arvo oli aluksi? 

      + demosta 6 läpi 39, hylkyjä 6 (hyväksymisperusteena, että
        ohjelma vähintäänkin toimii niinkuin tehtävänannossa on

  - Hyvin harva on käyttänyt hyödykseen Tomin varattavia
    ohjauksia. Toivottavasti sessioista on kuitenkin ollut hyötyä.

*** Käsittelemättä jäivät edistyneempi vuoronnus ja skriptaus

Vuoronnuksesta ja vuoronnusmenettelyistä lyhyesti:
- yksinkertaisimmillaan FCFS (first come first serve), "eräajo"

- moniajossa yksinkertaisimmillaan Round-robin

- prioriteetit, esim. prioriteettikohtaiset kiertojonot;
  monimutkaistaa vuorojen jakamista - tarvitaan monipuolisempi
  vuoronnusalgoritmi; vaarana mm. nälkiintyminen (matala prioriteetti
  ei ehdi saada juuri lainkaan aikaa)

- dynaamiset prioriteetit

- reaaliaikajärjestelmät ja -vaatimukset, prioriteetit ja
  pre-emptiivisyys, watchdogit

- kompromissit esim. vasteaika vs. throughput

- mikroydinmallissa käyttöjärjestelmän omien säikeiden vuoronnus ja
  prioriteetit vaikuttavat kokonaisuuden toimintaan

Eräs IPC:henkin liittyvä yksityiskohta:

- Käyttöjärjestelmän suorituksesta ja moduulijaosta; kernel mode
  vs. user mode.

- Käyttöjärjestelmän ajonaikaisesta rakenteesta: monoliittinen
  vs. microkernel

    + vuoronnus, kutsurajapinta ja IPC-menettelyt tarvitaan
      käyttöjärjestelmätilassa, mutta muut palvelut voivat tapahtua
      joko käyttöjärjestelmätilassa tai käyttäjätilassa;
      palveluprosessit voivat kommunikoida ja synkronoida toimintonsa
      IPC-menettelyjen kautta.

    + Käytännössä yleensä hybridi, jolla haetaan kompromissia
      (mm. modulaarisuus, turvallisuus ja toimintavarmuus vastaan
      suorituskyky).

- Uusinta tutkimusta aiemmista aihepiireistä? Katsotaan vähän vaikka
  WoKista ja ACM digital librarysta hakusanoilla "deadlock", "process
  synchronization", "microkernel" (tai muita tähän mennessä nähtyjä
  avainsanoja).

- Yksi esimerkki microkerneliksi suunnitellusta ytimestä on "Plan 9
  from Bell Labs": http://plan9.bell-labs.com/plan9/


Johdattelua skriptaukseen:

- katsotaan läpi muutama etäkäyttökoneelta ja/tai netistä löytyvä
  skripti erilaisiin tarkoituksiin, esim.:

    + ohjelman käynnistäminen tietyssä ympäristössä tai tietyin
      lisäargumentein, esim. yliopiston palvelimilla komento "c99" on
      skripti, joka tekee esivalmisteluja ja käynnistää varsinaisesti
      gcc -kääntäjän.

    + järjestelmäpalveluiden käynnistys/pysäytys, kokonaisjärjestelmän
      ylösajon operaatiot; esim. yliopiston palvelimilla skripti
      /etc/rc.sysinit tapahtuu käynnistyksessä; mm. yhdistää
      hakemistopuuhun tiedostojärjestelmiä, aloittaa heittovaihdon ym.

    + monisteessa luetellaan useita muita shell-sovelluksia

- shellin perusrakenteita (demotehtävän 6 tasolla); esimerkkinä c99:n
  käynnistysskripti, jossa on muuttujia, for-silmukka, case-ehdot,
  tulosteen ohjaus virhetulosteeksi.

*** Mitä siis ehdittiin tänä vuonna

Yleiskuva luentomonisteeseen - luvut 1-12, 14 ja 15. Koodiliitekin on..

*** Sitten kertaus ja tärpit!

Tentin kysymystyypit ja yleinen rakenne julkaistiin noin 5 vuorokautta
ennen tätä luentoa.

Yleiskuvaa:

- kysymyksiä on muutamaa eri tyyppiä: väittämiä, termien yhdistämistä
  niitä kuvaileviin määritelmiin tai
  ominaispiirteisiin. Esimerkkiskenaarioihin tai mallikoodeihin
  perustuvia väittämiä ja "mikä on lopputulema"
  -tyyppisiä. Vastauksena joka kohdassa on kirjain, järjestetty jono
  kirjaimia tai lukuarvo.

  Kysymyksissä pitää olla tarkkana, koska jokainen sana vaikuttaa
  luonnollisessa kielessä ja jokainen merkki vaikuttaa
  ohjelmointikielen syntaksissa!

  Alkuperäisessä, muotoilemattomassa mallitentissä on kysymysten
  lisäksi mallivastaukset sekä pohdintaa.

- alkupuolella erillisiä osaamistavoitteita on useampia, joten
  aihepiirit saattavat vaihdella enemmän tenttikerrasta toiseen.

- on myös "kestotärppejä" eli aihepiirejä, joista tullaan kysymään
  joka tentissä (joskin eri kysymyksiä ja mahdollisesti tahallaan eri
  tavoin toimivan esimerkin kanssa, joten mallivastausten opettelu
  ulkoa ei auta, vaan koodien ja algoritmien toiminta pitää ymmärtää):

  + erityisesti shell-komentojonot, minish-toteutus,
    assembler-ohjelma, pino ja aktivaatio debuggerissa, sivutaulut ja
    osoitteenmuunnos.

- Tehtävissä tarkoituksella "harhautuksia", joten vastaaminen
  edellyttää ymmärtämistä ja annetun esimerkin tarkkaa läpilukua.


Ei muuta kuin onnea (...eipäs kun osaamista) -- tenttiin!

Keskustelua, jos aikaa on!!


** Palauteluento ekan tentin jälkeen 2015 (vapaaehtoinen/täydentävä)

Koska salia ei ole, tämä tullee nyt vaan meilitse, kunhan ensimmäisen
tentin arvostelu on tehty.

*** Agenda:

- Arvio vastauspapereihin kirjatuista ja jälkikäteen ilmoitetuista
  kommenteista kysymyksiin liittyen. Alustavat kommenttini niistä,
  ennen kuin ehdin meditoida asian ympärillä enemmän.

- "Vapaa sana" -vastaukset (anonymisoituina) ja omat kommenttini
  niistä.

- Yleistä palautetta demojen tarkastuksessa havaittujen ilmiöiden
  pohjalta (pääasiassa tulevia opintoja ja alalla toimimista
  silmälläpitäen)

- Kysymyksiä, kommentteja, keskustelua.


*** Sähköpostilistalla esittämäni toimintasuunnitelma:

Kysymysmuoto oli uusi, ja silloin on "bugien" riski suuri. Saa nähdä,
miten tässä käy.. että onko sitä hommaa nyt enemmän vai vähemmän kuin
avoimissa kysymyksissä, ja saadaanko järkevän näköistä
arvosanajakaumaa. Mikäli arvosteluperusteita täytyy justeerata,
tehdään muutokset tietenkin opiskelijan eduksi, jos niitä päädytään
tekemään. Ei ollut vielä lupaus, ennen kuin vastausten kokonaisuus ja
koko populaation arvosanajakauma on selvillä.

113 perinteisen "esseetentin" tarkastaminen kestäisi itselläni useita
työpäiviä, missä ajassa luultavasti ehdin suorastaan tekemään
automaattisen tarkistimen, johon [tämänkertaisen tenttimuodon]
vastaukset voi syöttää. Optista lukijaa ei (vielä tässä
vastausmuodossa) pysty käyttämään, mutta pikaisen testin perusteella
yhden vastauspaperin manuaalinen syöttäminen kestää 30 sekuntia, mikä
on kokonaisuuden kannalta olematon aika. Sieltä saapi sitten nähtyä
myös kysymysten osalta, onko jokin ollut selvästi vaikeampi /
mahdottomampi kuin jokin toinen.


*** Arvio tavoista, joilla arvostelua korjataan tarvittaessa:

- Kysymyksen poistaminen arvostelusta kaikkien osalta ei tarkemmin
  ajatellen ole oikeudenmukaista. Monitulkintaisuus on varmasti
  hienovaraisissa nyansseissa, joita ei ole tullut ajatelleeksi
  kysymyksen tekijä, eikä luultavasti suurin osa
  vastaajistakaan. Olisi paha, jos suurimmalta osalta kumoutuisivat
  pisteet tapauksessa, jossa monitulkintaisuuden havaitseminen vaatii
  syvällisempää eforttia.

  Miten sitten voisi toimia? Tämän hetkinen suunnitelmani:

  + Moniselitteiseen kysymykseen hyväksytään kaikki oikeiksi
    tulkittavat vastaukset, +0.5 pistettä

  + Muissa kuin väittämäkysymyksissä ei kuitenkaan hyväksytä
    vastauksia, jotka ovat tulkinnasta riippumatta vääriä (niistä
    edelleen miinuspisteitä)

  + Tyhjä kohta, jossa on mainittu moniselitteisyydestä, tulkitaan
    oikeaksi vastaukseksi, koska löytyy ymmärrystä osoittaa
    monitulkinnallisuus. Tästä +0.5 pistettä.

  + Tyhjä kohta, jossa ei ole mainittu moniselitteisyydestä, tulkitaan
    edelleen ohitetuksi. Edelleen 0.0p.

  Uskoisin, että näin (1) ei rokoteta ketään turhaan, (2) ei vähennetä
  pisteitä tyypeiltä, jotka ovat luottaneet kysymykseen omana
  supertärppinään (3) ei myöskään palkita "tuulituloksella" niitä,
  jotka eivät ole osanneet vastata suuntaan saati toiseen.

  Toimintamalliehdotusta saa kommentoida. Lopullinen arvostelu tapahtuu
  automaattisesti; tieto perustelun olemassaolosta kirjataan
  arvosteluskriptiin.

  (sanoinko skripti? juu, samalla python-skriptillä tullaan
  arvostelemaan, millä kysymykset on generoitu
  kysymyspankista... pittää vaan liittää tietorakenteisiin vielä
  lippuattribuutti, oliko kysymys havaittu
  huonoksi.. kysymys.isBadQuestionOMG())


*** Tentin osallistujien esitykset monitulkintaisiksi kysymyksiksi:

Mahdollisesti tai todennäköisesti arvosteluun vaikuttavia huomioita:

- Tehtävä 1: Tapahtui reaalimaailman "off-by-one" -virhe.. [luennolla
  sanoin muuten "one-off", joka on tietysti väärä sana tähän
  tarkoitukseen. Off-by-one on oikea termi...] olin heti niin
  tyytyväinen ensimmäiseen kysymykseen, että sitä en juurikaan
  ajatellut enää uudempaan kertaan, vaan tarkka läpikäynti lähti
  kysymyksestä 2, koska "se ensimmäinenhän on jo varmasti OK, kyllä mä
  sen tiedän". No ei se ihan ollut. Opiskelijoiden havaintoja:

    + "moniselitteinen, koska ei voida tietää puhutaanko koko
      lähdekoodista vai tarkoitetaanko vain sitä, että prosessin omat
      säikeet toimivat prosessin koodin sisällä, sillä ne eivät
      välttämättä käytä koko koodia"

    + "A, jos siis tarkoitetaan sitä koodia ohjelmoijan kirjoittamana
      tekstipötkönä, ei sitä, ettäkö säikeet suorittaisivat aina samaa
      kohtaa koodista. Tässä mahdollinen monitulkinnallisuus?"

    + "Valtavan epämääräinen sana 'koodi'"


  Mielessäni tarkoitin koko ajan "prosessin koodialue on sen säikeille
  yhteinen", enkä tulkinnut tehtävänantoon päätynyttä tekstiä siten
  kuin se oli ("prosessin koodi on sen kaikille säikeille
  yhteinen"). Siis tuo "koodi" voi olla paljon kaikkea: lähdekoodi
  (hyvin todennäköisesti eri lähdekoodi jokaisella säikeellä),
  käännetty binäärikoodi (jossa todennäköisesti eri osio jokaisella
  säikeellä), prosessin virhekoodi, salauskoodi..

- Tehtävä 7: Kysymyksenasettelu meni pieleen, joten arvostelu vaatii
  tältä osin jonkin oikeudenmukaisen korjauksen. Havaintojen yleiskuva:

    + Esimerkissä menin ja sanoin että skenaariossa on 10
      intensiivisesti laskevaa sovellusta. Nämähän pyörähtää 50Hz
      kellolla läpi 5 kertaa sekunnissa jokainen. Väliin mahtuu myös
      satunnainen muu prosessi viimeistään 0.2 sekunnin sisällä,
      vaikka se tulisi kiertojonon perältä. Ei tämä nyt ihan
      megaluokan viive olisi ihmisen näkökulmasta. Eri asia olisi
      reaaliaikajärjestelmä, jossa on pakko kelata jonoa
      nopeammin. Mutta tällaista ei nyt ollut spesifioitu tehtävän
      esimerkkiskenaariossa.

    + lisäksi sanamuoto voisi olla "painottaa vähän" tai "vähän
      laskentaa vaativia". Luonnollinen kieli on ikävästi
      moniselitteistä; onneksi on ohjelmointikielet syntakseineen :)

  Alustava suunnitelma siis, että A, B ja "perusteltu tyhjä"
  hyväksytään kaikki oikeina vastauksina (+0.5p). Tyhjä ilman
  perustelua normaali 0.0p

- tehtävät 21--22: Tässä on muutaman opiskelijan kanssa keskustelu /
  väittely kesken, että oliko kyseessä oikeasti osaamistavoitteita
  mittaava kysymys vai "liian paha kompa" tiedostopäätteestä .tex tai
  sen puuttumisesta johtuen. Jonkinlainen ratkaisu tästä tulee, mutta
  toistaiseksi auki.

  Mahdollisesti on höllennettävä väärän vastauksen miinuspisteitä
  tämän osalta. Mutta tyhjäksi tätä ei varmasti ole jättänyt kukaan,
  jolla oikea osaaminen löytyy. Huolimattomuus on sitten asia
  erikseen, ja pittää pohtia, kuinka paljon sitä sitten saisi sallia.

- Tehtävä 28: Tapahtui perinteinen "viime hetken tarkennus", joka ei
  ollut loppuun asti harkittu. Note to self: älä tee viime hetken
  tarkennuksia. Tarkkaavaisen opiskelijan havainto:

  + "Mahdollinen monitulkinta: ohjelmakoodissa sem.arvo on kurssin
    mallin mukaan kokonaisluku (joka siis voi olla etumerkillinen
    kuten koodissa on 'if (sem.arvo <= 0))', mutta todellisuudessa ei
    arvo koskaan laske pakkasen puolelle. Ei voi olla vaikkapa '-2'
    vapaata tai täyttä paikkaa.

  Näin se on. Toteutus voisi antaa semaforin arvon mennä pakkasen
  puolelle, jolloin sen itseisarvo tarkoittaisi jonottavien prosessien
  määrää.. Tämä ajatus nyt ei ollut itsellä mielessä, kun "tarkensin"
  tehtävänantoa viime hetkellä. Uusinnoissa tämä väite tulee muotoon,
  jossa etumerkistä ei puhuta. 

  Tällä kertaa tässäkin hyväksyttävä A ja B sekä kommentoitu tyhjä.

- Tehtävä 29: Edellisen kohdan vuoksi mahdollisesti myös
  moniselitteinen. Tutkitaan ennen kuin hutkitaan.

- Tehtävä 45: En vielä tiedä toimintamallia, ennen kuin nähdään kaikki
  vastaukset. Opiskelijan havainto:

    + "B, koska käyttäjä voi itse määrittää tiedoston nimen"

  Nythän on niin, että voi määrittää.. mutta tiedostoon voi määrittää
  useita nimiä ns. kovina linkkeinä. Asia on mielestäni kyllä
  kirjoitettu auki aika hyvin monisteen nykyiseen versioon. Samoin se,
  että nimi ei ole osa tiedoston sisältöä eikä myöskään i-solmun
  sisältöä. Itse asiassa monisteen lopullisessa versiossa on
  suorastaan kursiivilla (harvoissa ja valituissa paikoissa käytetty
  tehokeino!) seuraava täsmällinen ilmaisu: "tiedoston nimi määräytyy
  hakemistotiedostoon kirjatun merkkijonon perusteella!"

  Voi olla, että evidenssi ei tule riittämään tämän tehtävän
  arvostelun muuttamiseen.

Havaintoja, jotka eivät välttämättä aiheuta toimenpiteitä:

- Lukuisia yksittäisiä havaintoja; erityisesti sellaisten
  ääritapausten pohdintaa, joihin asti johdantokurssilla ei
  päästä. Olin jo aikeissa ennen tenttiä meilata, että "elvistely on
  sallittua, jos sille on oikea osaamispohja olemassa". Tulen käymään
  näiden muutamien "Agoran elvisten" tiuhaan kommentoidut
  vastauspaperit läpi erikseen, ja jos kommentit ovat tarkoin
  analysoituna valideja niin antaa mennä vain... Vastauspaperien
  yleiskuva (ilman tarkempaa tarkastelua) voisi viitata siihen, että
  nämä ovat osaamisensa aiemmin hankkineita, joiden arvosanat
  painottuvat yläpäähän joka tapauksessa.

  Tämä sinänsä miellyttävä "gurujen" kanssa operointi ei vaikuta
  johdantokurssin tietojen pohjalta tehtyihin vastauksiin.


*** "Vapaaehtoinen vapaa sana" -kysymyksen vastaukset:

- "Varsin selkeä kurssi. Osaamistavoitteet selkeytti ja mallitentti
  helpotti varsinaiseen tenttiin lukua, kun näki vähän sokeita
  pisteitään. Lisäksi se, että näki kysymystyypit ennakolta helpotti
  ja nopeutti tenttiä. Ihana tavoite: opiskelija *uskaltaa* ja osaa
  käyttää selliä. Siinä on pieni kynnys, kyllä."

  Kiitos positiivisesta palautteesta. Voin kertoa, että mietin
  tavoitteita tarkoin, ja tuo "uskaltaa" on olennainen osa, vaikka
  mielestäni tärkeintä kyseisessä tavoitteessa onkin "aiheuttamatta
  vaaraa omille tiedoille tai häiriötä muille käyttäjille tai
  järjestelmälle" :)

- "Harmi kun kaikki mielenkiintoinen ja tärkeä tiivistyi n. 5
  viimeiseen luentoon. Pehmojohdanto oli parasta viihdettä vähään
  aikaan. Luennot aina yhtäaikaa eikä jaksanut käydä siksi
  paikalla. Kiva kun demoilla ei kovaa kiirettä."

  Kiitos rakentavasta palautteesta, jossa oli positiivisiakin
  osioita :). Itse olen sitä mieltä, että alusta lähtien kaikki oli
  tärkeää. Mielenkiintoisuus on subjektiivista. Omasta mielestäni
  alkupuolen asia on huikean mielenkiintoista, mutta kuten monisteen
  johdannossakin totean, henkilökohtaiset mielenkiinnon kohteet
  vaihtelevat varmasti. Tarkoitus oli, että alkupuolella tulisi
  tekninen pohja ymmärtää ilman suurempaa käsienheiluttelua
  loppupuolen asiat, joissa ns. "korjataan hedelmät" (termi, jota joku
  matematiikan luennoitsija aikoinaan käytti siitä, kun alkupuolen
  teoreettisilla tuloksilla aletaan viimeisillä luennoilla tehdä
  jotakin hyödyllistä :))

  Pehmojohdanto ilmaantui viimevuotisen yksittäisen palautteen
  perusteella, ja sen on tosiaan tarkoitus olla
  viihteellinen. Tulevaisuudessa siirrän sen ehkä kuitenkin
  liitteeksi, jolloin pääteksti menisi ensimmäisillä sivuilla suoraan
  tekniseen asiaan.

- "Vaikeata on, kun tulee miinuspisteitä. Kurssin alussa olleet demot
  olivat liian helppoja, niin kuljin vähän löysin rantein. Pistä
  seuraavalla kerralla assembler-jutut heti ja skriptit lopuksi, niin
  lähtee oikeammalle raiteelle.

  Kurssin asiasisältö on kokonaisuutena OK ja materiaali oli hyvää.

  Sellaista toivoisin, että jos keräsin nyt vahingossa liikaa
  miinuksia, enkä pääsekään läpi, niin voisitkohan tiedottaa
  epäonnistumisesta heti? Muuten en ennätä valmistautua uusintaankaan.

  Mukavaa oli, että tenttitilaisuudessa on kunnolla aikaa."

  Kiitos jäsennellystä palautteesta, hyvistä huomioista ja
  kohteliaista lisäyksistä :).

  Miinuspisteiden osalta on ehkä katsottava kaikkien 113 tenttijän
  tulokset ja tehtäväkohtaiset pisteet, ja mietittävä, onko se -0.5
  pistettä liikaa arvaamisen kitkemiseksi. Väittämätehtävissä
  odotusarvo arvaamalla olisi 0, ja nyt kun on myös "yhdistä lauseita"
  ym., joissa oikean vastauksen arvaustodennäköisyys on mallia 25%,
  niin arvaamisen odotusarvo oikeastaan on negatiivinen.

  Voi olla, että pienemmälläkin miinustuksella saataisiin
  minimaaliseksi riski päästä arvaamalla läpi. Maito on tietysti jo
  maassa siinä mielessä, että arvosteluperuste (-0.5 väärästä) oli
  tiedossa tenttiä tehtäessä, joten jokainen tenttijä on tehnyt oman
  riskiarvionsa sen tiedon varassa. Tällä perusteella tätä ei ehkä
  uskalla jälkikäteen enää muuttaa tämän kurssikerran
  osalta. Katsotaan ja analysoidaan tulokset, ja tehdään sitten
  toimenpiteitä.

  Erityisesti katsotaan, että arvosanajakauma käy järkeen. 113 hengen
  populaatio on uskoakseni riittävän suuri arvioiden tekemiseen ja
  vertaamiseen aiempiin kurssikertoihin, vaikka kysymykset nyt
  erityyppisiä olivatkin.

- "GNU/Linux; kernel ja käyttis ovat eri asia, kernel ei yritä
  toteuttaa POSIXia"

  Hyvä täsmennys. Asiahan on selvä, mutta on saattanut jäädä sanomatta
  juuri noilla sanoin. Kirjataan se jatkossa materiaaliin noilla
  sanoin. Uskon kuitenkin, että tällä kurssikerralla saatiin riittävän
  useaan otteeseen käsiteltyä kirjastojen kerroksia ja ytimen
  kutsurajapintaa, joten kokonaisuuden jälkeen pitäisi olla kyllä
  selvää, mihin kirjasto loppuu ja ydin alkaa, ja mihin kerrokseen
  POSIXin toteuttaminen sijoittuu.

HUOM: Jos muistat laittaneesi tenttipaperiin jotakin, mitä tähän ei
ollut kaivettu, niin ilmoita!! Koska olen mielestäni ottanut kaikki
papereissa olleet kommentit tähän.

[Seuraavat löytyivät tarkemmassa läpikäynnissä luennon jälkeen]:

- "Tulin tähän tenttiin koska olin unohtanut poistaa ilmoittautumiseni
  ajoissa. Tarkoitus oli tulla tekemään koe vasta 12.6., eli tähän
  tilaisuuteen ei oltu valmistuttu. Ompas käsiala huonontunut kun
  tässä opinahjossa on vuoden viettänyt."

  Propsit siitä, että tulit paikalle tenttitilaisuuteen, johon olit
  ilmoittautunut! Onnea ja osaamista seuraavaan yritykseen
  12.6. Käsiala kannattaa pitää kunnossa. Pidemmän päälle joutuu melko
  todennäköisesti draftailemaan suunnittelukaavioita, mindmappeja ynnä
  muuta, joista kavereiden täytyy saada selvää. Alussa ei vielä ehditä
  tuohon opinahjossa, kun on niin paljon koodattavaa :).
- "Tentti oli hyvä."

  Noh.. kiva että ainakin joku tykkäsi :) Katsotaan onko tilanne sama
  vielä arvostelun jälkeen...

- "Unohdin lukea tenttiin :)"

- "Täytyy vielä vähän treenata..."

- "Valitettavasti tälle kurssille ei jäänyt aikaa, mutta opiskelen
  varmaan kesällä ja tentin heinäkuussa :)

  Uusinnassapa sitten!

- "Hyvä kurssi. Haastava verrattuna moneen ja taitaa uusintaan tentti
  mennä. You are not prepared!"

  Kiitos positiivisesta palautteesta. Haastaviahan kaikkien kurssien
  pitäisi olla, eihän niissä muuten oppisi uutta :). Next time you'll
  be prepared!

- "Tuuletetaan! (toivottavasti tarkastuksen jälkeenkin on syytä siihen)

  Tutkitaan ennen kuin hutkitaan. Kyseisen palautteen antaja voi
  kylläkin tuulettaa vähintään selkeää läpipääsyä vastausrivinsä
  yleiskuvan perusteella. Mallia monta oikein, eikä yritelty arvailla
  liikaa.

- "Ei voi mennä läpi. :)"

  Hyvä, jos tilanne kuitenkin hymyilyttää hymiön verran :). Uusinnassa
  sitten!

- "Monivalinta on yllättävän hyvä tenttimuoto; vääristä vastauksista
  tosin rokotetaan ehkä turhan ankarasti, vaikka virhe ajattelussa voi
  olla pieni. Kiitokset hyvästä kurssista!"

  Kiitos positiivisesta palautteesta sekä perustellusta kritiikistä!

  Kyllähän se näin jälkiviisaasti ajatellen on rankka rokotus tuo -0.5
  pistettä. Nyt kun sitä ei etukäteen osattu arvata, niin tämän kanssa
  on elettävä vielä kesän kaksi uusintaa (ks. perustelut
  yllä). Populaation tasolla skaalataan kokonaispisteytystä kaikkien
  osalta tarvittaessa, jos tarvetta ilmenee.

- "Mukava kurssi, paljon asioita jotka on hyvä tietää. Tavallaan
  hyötyy ja tavallaan kärsii demojen vapaammasta aikataulusta
  (soveltuu kyllä hyvin kiireisemmän opiskelijan aikatauluun).

  Kiitos positiivisesta palautteesta ja rehellisestä mielipiteestä
  aikataulutuksesta. Deadlinet ovat pohdituttaneet paljon vuosien
  varrella, ja jokaisessa ratkaisussa on hyviä ja huonoja puolia.

- "Muistutti niin paljon mallitenttiä, että tuntui helpolta. Kohta 28
  meni arvailuksi, muut kuvittelen tietäväni."

  Näin oli tarkoitukseni, että malliin tutustutaan ja sitten tuntuisi
  helpolta. Mutta toivottavasti olit myös tarkkana, koska tehtäviä oli
  muutettu malliin nähden! Automaatti sen aikanaan kertoo.

  Tehtävää 28 ei olisi kylläkään välttämättä kannattanut arvata :)
  Katsotaan nyt, miten kyseisen tehtävän arvostelun kanssa käy
  ylipäätään (ks. palauteluennolla läpikäydyt huomiot ylempänä).

- "Kurssi oli loistava, mutta Ohjelmointi 2 ja vaihtoon hakeminen
  söivät voimavaroja suoritukselta. Tehtävät olivat paras
  osa. Erityisen selkeä opastus ja harjoitteet vähensivät pelkoa
  uudelta unixkäyttäjältä"

  Kiitos positiivisesta palautteesta. Olen tehnyt paljon töitä
  mm. mainitsemiasi piirteitä kohti eli selkeää opastusta ja
  pelkokertoimien pienentämistä uusien teknisten asioiden lähestymistä
  kohtaan. Toivottavasti vaihtokohde löytyy! Vaihtoon lähteminen on
  erittäin suositeltavaa. Muista sopia vaihdossa tehtävistä kursseista
  *etukäteen* oman opintoneuvojan kanssa :)

- "Pitäisi katsoa luentotallenteet ainakin kaksi kertaa lisää ennen
  kuin tuntisi osaavansa."

  Niitä voi onneksi kotona kelailla tylsien osien yli ja katsoa
  tuplanopeudella tai hidastettuna tarpeen mukaan :)


*** Yleistä palautetta demoista

Nämä löytyvät demosivustolta (ei varsinaisa spoilereita niille, joilla
demot on vielä kesken):

http://itka203.it.jyu.fi/pages/geneerinen_palaute_opiskelijoille_2015.rst

Käydään läpi luennolla, jos ehditään.