allora partiamo dall' inizio
esempio pc(ovvimente monocore)
sopra la cpu c'è lo scheduler, ogni app che lancio genera n thread che vengono gestiti dallo scheduler, assegnando ad essi del tempo cpu, ed intervallando l'esecuzione(context switch) dei vari thread in modo da dare l'impressione che siano in esecuzione contemporaneamente ed abbiano accesso contemporaneamente alle risorse.
questo si chiama multitasking preemptive
poi c'è il multitasking cooperative, dove non è lo scheduler a gestire le risorse cpu, ma sono i processi stessi, ovvero quando un processo è in esecuzione posso fare il context witch solo se il processo viene terminato o se va in ibernazione.
il secondo caso è quello di ios.
android invece gestice diversamente la cosa, se non uso un services, l'applicazione in background mi viene killata e ne viene salvato lo stato quando necessito di memoria, se invce uso services lo faccio perchè voglio che l'app rimanga in background e non venga mai killata dal sistema, a quel punto viene gestita in autonomia dallo scheduler in modo preemptive.
quindi dire che il mt di android funziona come quello di ios è profondamente errato, entrambi mirano a non avere troppa roba in background per non appesantire ram e cpu, ma concettualmente si basano su due tipologie diverse, inutile dire che la più in voga è la preemptive.
coi video che continui a linkare non vedi mica come è la gestione dei task,magari, così gli esami di sitemi operativi li faremmo tutti su youtube anzichè sui libri.