File

Da Wikipedia, l'enciclopedia libera.
Il comando ls mostra l'elenco dei file in una o più cartelle

In informatica, il termine file (traducibile dall'inglese come "archivio", ma comunemente detto anche "documento"), viene utilizzato per riferirsi a un contenitore di informazioni/dati in formato digitale, tipicamente presenti su un supporto digitale di memorizzazione opportunamente formattato in un determinato file system. Le informazioni scritte/codificate al suo interno sono leggibili solo tramite uno specifico software in grado di effettuare l'operazione.

Indice

Descrizione generale

Il concetto di file è molto semplice: un file è una sorgente (o un deposito) di informazioni, che si può leggere e scrivere; questa sorgente/deposito ha anche delle "proprietà" (nome, estensione, flag) che possono essere modificate. Questa definizione si adatta molto bene a molte periferiche ed interfacce hardware; i sistemi operativi Unix e derivati (Unix-like) hanno generalizzato il concetto di file tanto da farne una vera filosofia: in Unix tutto è un file, cioè può essere "aperto", "chiuso", "letto", "scritto" eccetera; questi "file speciali" possono essere delle comunicazioni fra processi, delle pipe, delle interfacce hardware o altro ancora: il sistema operativo si occuperà di gestire tutto nel modo appropriato lasciando ai programmi l'illusione di stare usando un normale file.

Se dal punto di vista dell'utente un file è solitamente un singolo elemento, può succedere invece che fisicamente sia scritto o risieda su più zone diverse del supporto di memorizzazione che lo ospita: questo fenomeno è molto comune se il supporto di memorizzazione è un disco di memoria, mentre è molto raro su nastri magnetici. Uno dei compiti del sistema operativo è rendere trasparente alle applicazioni la reale suddivisione fisica del file e occuparsi di gestire il recupero delle informazioni in esso contenute (lettura) dai vari blocchi fisici del supporto di memorizzazione e la scrittura.

Caratteristiche tecniche

Tecnicamente, i dati di un file sono codificati/organizzati in una sequenza di byte in linea con il linguaggio binario usato dal computer, immagazzinati come un solo elemento su una memoria di massa attraverso il file system (sistema di archiviazione) esistente su quella data memoria. Il sistema, quando riceve una richiesta dall'utente (esempio: aprire un file), provvede poi all'operazione inversa di decodifica e visualizzazione, facendo apparire sul video parole e numeri.

Una sequenza di byte in RAM non è ritenuta solitamente un file, a meno che non sia immagazzinata in un disco virtuale risiedente in RAM. Nei primi sistemi di elaborazione i file erano gestiti ed elaborati sequenzialmente, quindi per poter analizzare le ultime modifiche al file bisognava scorrere l'intero file e leggere in fondo le ultime modifiche. Nei sistemi operativi moderni questo non è più vero, dato che il file system provvede ad estrarre l'organizzazione fisica del file ed a riorganizzare il file stesso nel caso sia necessario.

Elementi tipici

Ciascun file è identificato da un nome univoco, un percorso (path) che ne individua posizione, contenitore, cartella o directory in uno spazio di nomi gerarchico all'interno del file system stesso, ed eventualmente può recare nel nome un'estensione.

Il contenuto dei file è normalmente conforme ad un particolare formato, e per ciascun formato esistono una o più applicazioni che sono in grado di interpretarne e/o di modificarne il contenuto ("aprire" il file). Alcuni sistemi operativi, come Microsoft Windows e l'MS-DOS, riconoscono il formato di un file in base all'estensione del loro nome; altri, come il Mac OS, da una serie di metadati salvati insieme al file; altri ancora, come Unix, identificano i tipi di file in base ai primi byte del loro contenuto, detti magic number.

Operazioni sui file

Poiché accedere ad un archivio informatico da una memoria di massa è una operazione piuttosto lenta, necessita di una conoscenza dettagliata dell'hardware del computer e crea un rischio di conflitto di risorse fra programmi in esecuzione, queste operazioni sono eseguite dal sistema operativo per conto dei programmi che le richiedono. Le operazioni più comuni, universalmente presenti in tutti i sistemi operativi, sono:

  • Apertura: il programma segnala al sistema operativo che ha necessità di accedere a un certo file. Il sistema operativo controlla che il file esista e che non sia già usato o bloccato, da esso o da un altro programma; crea alcune strutture dati per gestire le operazioni successive e riserva una certa quantità di memoria RAM, detta buffer, per memorizzare i dati in transito da e per il file; restituisce al programma un simbolo (o un handle oppure un indirizzo di memoria fisica) a cui il programma farà riferimento nelle successive operazioni sul file; gli altri programmi possono accedere allo stesso file solo in modo limitato (solo lettura) o non possono accedervi affatto.
  • Lettura: il programma richiede dei dati dal file. Il sistema operativo li legge, li memorizza nel buffer di cui comunica l'ubicazione al programma richiedente.
  • Scrittura: Il programma vuole scrivere dei dati in un file. Per prima cosa memorizza i dati in questione in un buffer, di cui poi comunica l'ubicazione al sistema operativo.
  • Chiusura: il programma comunica che non ha più bisogno del file. Tutte le strutture dati e il buffer allocato vengono rilasciate; il sistema operativo elimina il file dalla lista di quelli in uso; gli altri programmi hanno ora libero accesso al file.

Di per sé il sistema operativo, tramite il file system, è in grado di compiere le seguenti operazioni:

  • Riallocazione: il sistema operativo è in grado di spostare o muovere il file da una directory all'altra (ad esempio, tramite copia e incolla se l'interfaccia è grafica, oppure tramite digitazione da terminale se l'interfaccia è a riga di comando).
  • Rinominazione: ridenominazione del file tramite assegnazione di un nome diverso per via grafica o da riga di comando.
  • Sovrascrittura: sovrascrivere il contenuto di un file con quello di un altro file con lo stesso nome.
  • Eliminazione: rimozione del file dalla memoria di massa che lo contiene, andando però solo ad eliminare il collegamento logico-fisico del file in memoria, il cui spazio di memoria risulterà dunque non vuoto, ma libero nel senso di sovrascrivibile.

Un programma non può leggere o scrivere un file se prima non lo ha "aperto", e una volta finito di usarlo lo deve sempre "chiudere" per dare modo al sistema operativo di liberare le risorse occupate.

Trasferimento di file

Si possono utilizzare vari modi e tipologie di connessione diverse per trasferire file in una rete. Per esempio è possibile condividere e trasferire i file in una rete LAN tra due o più computer, utilizzare la posta elettronica, oppure usare dei servizi o programmi appositamente dedicati allo scopo (es. FTP).

Il trasferimento di file attraverso una rete può diventare problematico se non si dispone di una connessione sufficientemente veloce, in particolare se si tratta di file di grosse dimensioni. Per esempio per trasferire un file tramite Internet è opportuno contenerne la dimensione, altrimenti può essere necessario molto tempo per eseguire l'operazione. Quando le connessioni tra computer erano particolarmente lente, per contenere la dimensione di un file si usavano varie tecniche: per esempio era possibile comprimerlo o suddividere il singolo file in file più piccoli e spedirli singolarmente; queste operazioni potevano richiedere l'uso di programmi specifici. Con l'avvento della banda larga queste operazioni preliminari sui file stanno andando in disuso.

È possibile trasferire uno o più file tramite la comune e-mail. Per il trasferimento via e-mail va tenuto presente che normalmente i fornitori di servizi Internet limitano la dimensione di ogni singolo messaggio: per esempio Gmail limita la dimensione degli allegati in trasmissione e in ricezione a 25 Megabyte. Inoltre l'intera casella e-mail può avere dei limiti nella sua dimensione totale: per esempio Alice, nei contratti ADSL residenziali, limita a 3 Gigabyte la dimensione dell'intero contenuto di un account e-mail. È necessario tenere presente questi limiti quando si inviano file di grandi dimensioni, in modo da non rischiare che l'allegato non venga spedito, o di occupare interamente la casella di posta del destinatario.

In alternativa all'e-mail è possibile usare un programma di messaggistica istantanea, iscrivere il contatto e creare una cartella condivisa. Questi programmi, normalmente, non praticano limitazioni di banda legate all'estensione, alla dimensione e al tipo di file inviato.

Per il trasferimento di grandi quantità di file esistono anche dei servizi web di desktop remoto, che permettono di "parcheggiare" per alcuni mesi i propri file in un archivio privato, cui si accede con username e password (es. Dropbox) L'archivio può essere aperto alle persone desiderate dando loro username e password. Una variante di questi servizi sono quelli di upload remoto che creano una chiave di sessione comune a due utenti iscritti e collegati a Internet; caricato il file, il ricevente deve indicare un percorso dove salvarlo e autorizzarne il download.

Recupero dei file

È possibile recuperare un file cancellato definitivamente, utilizzando appositi programmi in grado di ripristinarli.

Quando si conferma la cancellazione di un file, per esempio svuotando il cestino di Windows, viene infatti cancellato (logicamente o fisicamente) il solo collegamento fisico esistente tra il nome del file ed il suo contenuto, per cui il file non è più accessibile né all'utente né ai programmi del computer. In assenza di altri collegamenti fisici, anche l'area della memoria di massa occupata dal contenuto dei file viene designata come disponibile per nuovi contenuti, tuttavia essa non viene cancellata o sovrascritta immediatamente, per cui i dati risultano ancora fisicamente disponibili sulla memoria con opportune tecniche fino all'effettiva sovrascrittura.

In particolare i programmi per il recupero dei file esaminano il contenuto di un file system cercando collegamenti fisici cancellati logicamente e controllando le aree occupate dai dati a cui essi fanno riferimento, ricopiandone il contenuto e, se possibile, ricostruendo le parti ormai sovrascritte.

Per prevenire invece il recupero di file cancellati (per esempio per questioni di privacy) esistono programmi che provvedono a sovrascrivere (anche più volte) il contenuto di un file prima di cancellarlo, o a sovrascrivere tutte le aree libere di un file system, in modo che non sia possibile il recupero dei dati.

Tipi di file

Exquisite-kfind.png Per approfondire, vedi Estensione (file) e Lista di formati di file.

Un tipo di file molto comune sono i file di testo ASCII. Un simile file è una sequenza di caratteri ASCII pura e semplice, tale da poter essere letta ed interpretata nello stesso modo da tutti i sistemi operativi. Il termine "file binario", invece, si riferisce solitamente a tutti i file che non sono di testo ASCII.

Aspetti legali

Italia

Ad avviso della Corte suprema di cassazione, Sez. VI 13.11.2003, nr. 3449, copiare archivi informatici non costituisce furto: infatti, è da escludere la configurabilità del reato, nel caso di semplice copiatura non autorizzata di file contenuti in un supporto informatico altrui, non comportando tale attività la perdita del possesso della res da parte del legittimo detentore.

L'orientamento è stato confermato dalla sentenza 21 dicembre 2010 n. 44840 - emessa dalla IV sezione penale - poiché i dati e le informazioni non sono comprese nel concetto di "cosa mobile".

Note

Bibliografia

Voci correlate

Altri progetti