将PIR、SWISS-PROT和TrEMBL3个蛋白质数据库统一-起来组建而成,包含3个部分: (1) UniProt Knowledgebase (UniProtKB) ,这是蛋白质序列、功能、分类、交叉引用等蛋白质知识库,记录经过人工筛选和注释; ■ (2) UniRef ( UniProt Non-redundant Reference ) 数据库,将密切相关的蛋白质序列组合到一条记录中,以便提高搜索速度;目前,根据序列相似程度形成3个子库,即UniRef100、UniRef90和UniRef50; ■ (3) UniParc (UniProt Archive),是UniProt存档库 , 收录所有蛋白质序列。用户可以通过文本查询数据库,可以利用BLAST程序搜索数据库,也可以直接通过FTP下载数据。