Protein Data Bank utilise un format PDB pour stocker des données de structure déterminées expérimentalement de protéines et d'acides nucléiques. Un fichier PDB est un fichier texte qui comprend deux parties: une tête et une liste des coordonnées atomiques. L'en-tête est généralement de 300 à 600 les premières lignes du fichier qui contient les informations sur la protéine (par exemple nom, référence, la séquence et statistiques cristallographiques) et est accessible par l'ouverture comme un fichier texte. Les coordonnées atomiques permettent de visualiser une structure de protéine, par exemple en utilisant des programmes certain DS Visualizer, qui est un logiciel libre de Acccelrys Inc.