MonarchBase - Protein-coding gene

DPOGS211960
Transcript	DPOGS211960-TA	2718 bp
Protein	DPOGS211960-PA	905 aa
Genomic position	DPSCF300011 + 1074347-1082282
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA000909-TA	5e-180	50.55%
*Drosophila*	btv-PD	2e-79	28.39%
EBI UniRef50	UniRef50_D1ZZU4	5e-97	30.44%	Putative uncharacterized protein GLEAN_08109 n=3 Tax=cellular organisms RepID=D1ZZU4_TRICA
NCBI RefSeq	XP_975018.1	1e-97	30.44%	PREDICTED: similar to dynein heavy chain isotype 1B [Tribolium castaneum]
NCBI nr blastp	gi\|270005976	2e-96	30.44%	hypothetical protein TcasGA2_TC008109 [Tribolium castaneum]
NCBI nr blastx	gi\|270005976	2e-103	30.65%	hypothetical protein TcasGA2_TC008109 [Tribolium castaneum]

Group
KEGG pathway	tca:663896	3e-97
	K10414 (DYNC2H, DNCH2)	maps->	Phagosome
			Vasopressin-regulated water reabsorption
InterPro domain	[144-594] IPR013594	2.2e-31	Dynein heavy chain, N-terminal domain-1
Orthology group	MCL26310		Insect specific

Nucleotide sequence:

>DPOGS211960-TA
ATGAGTGAAATCCGAGCATATATATCAAAAGCGACCGAAAACTTCTTCAACGTGCCGACCCTAAAGCTAAGCGAGAGCAGCGAAGGAGTTCTGATTGATTTCATTCATAACCCATTAGTGTATCTGCTTCAAGCATGTGCATCAGAACAAAGACAAATCATGTTATATGCAGACGTTCGAGTGAGTGCAAACAAATCCATCATATTTTACAAGACCAGTGCCGTGGAACTAACGGGGTCAGACGCTTTGAACGACCTGAACATCATCACACTGACCACGGGTGCGGCGGAGTCTCTCTATCAGATCATAAGACATGTGTACACTCCGATGCTCACCATCGGTGATGATTTATTTTCTATTAAACTTCAAAAAACTTTACTAGAATTAGAATCGAATCTGAAGCTCGTCACTCACGGCGAGGGAGACGAAAATATTAAAGTTATTTTATCCGTTGAGGACGAAGTTGGTTATTGGAAGACCTTTGGAGAGAAGAGGGACATTAAGAAGAGTGAGAGGGAAGCAGCCTCCGCTTTCTGTGTTCTGTTCGAGGATATCTGTGAAGAGATCAGGTGTTTGCCCTCTATCGGTCTGCAGGAAGTGCGAGACTCCGCTGAGAACATCGGAGGTATACTGGACGACGTGTGGCGGTACTCTCCCACGCCGTACTCACAGGACAGGATGGTCCATATTTTTGATATCGTCGGGCACGTGATCTGCTCGGTCACTCAGCAGGCCGTATCCAGAACGGATTTGTGGCGGGTCCACCACGGTCTGAAGGATAATGAGATACTCCATCAACTAACAGAAGCTCTGGCTGCTGTGAAGGTGTGGGTCAGTACGTGTAAGACCCTCACGGACACGTACTGGCCGAACTACTCACTCCATGAATGGAAAGGAAAACCTTATGTGCCCGTATTCTGCCAGAATTTTCAAAAGAGACTTGAAGAAATTCACAGTATTAGGTCCACTTTTAACCAACTCAGTAAACTCTTGGCGAAATCTGAGAGGACTGAATTAAATAGCGACCAGCTATTGGAGCCCTTCAAGAATATAAATGTTTGGATATACAATGGGCACAATCAAATGTGGGAAAATGCAGTTTCAAGATTTTCGTCAAGTATCCGTCCAGCTGAAGCGAAGATAGCCGAGAAACTCAAACCGCGGCTACAGAATTTATCCACCAAGCAGTCCCTGTACGAGTTCTCAAGATACCGCACCTTGCTCAGTCGACCGCTAGTGCAGCAAGCTCTGACCCGAGAGCTGGAACTATTCCTGTCGTCGCTACTGACGATGATGAAGGACGTTAAATCACACTTGGAGGAAGACCTGCCGGGGCTGTACCACCCGCCCGAGATGACAGACCTGGTCGTCAAGGTGCAGTGGGCGAGGCAGATGGAGGACAAGGTGAAAGAAATAGAATCATGCGTCGGAACCGATCTCAGGAATTTGGAGGGAAGTGATGAGGTGCTGCAGCTGGCTGCCAAAGTGCAAAACGATCTGAAGAATACATACACGCAGCTATATGAGGAGTGGTCCAGAGACGTTCAGGCGCAGCTCAGGGCGGGGTCTCTTCAGCTGTCGGAGCGGCCCGTGGTAGAATTCTCTAGTGCTGACCGCCTCATGGTCGTCAACTATCCCGAGGGACTGGAGCGCGTTGAGCGAGAGGCGCGCGCACTGCTTGCAGCCGGGCTGCCGCCACCACCTGGCGCGCTCACAGGGCTCACGGCATCGCTACGATATGCGAGAGCGCTACACCAGGTGGCTTCTTTTCACAACACGCTGGGTGAACGTGCCGTGAGCTCAACACGGCCCATGTTGTTGCATGCAGCACTCCAGCTGGCGGCTCTGGTGGCAGACCACCGTCCCCCGTCTTGGACCGACGAGCGAGCTCTACATGAATACACACAGCAACTTAAGGAAAAAGTGATGGAGCTCGAGAAACAGAATAATTATCTCACCAGCCAACATTTAAAAATCCGAAGTATTGTCGAGAAGCTCATGGACACAGAGCTCCTTGCGAAACTCGCTGAATGGAAGAAAGGCATCAAGGATATCAGGGATATTATTGAGAAGGTGGAAGCCAATGGGTACGAGAATACAGAGATGTGGCGCTCCCACTGGGACCTGCAGCTGTACAAAGCCATGGAGTGTCAGTACATGAAGGCACTGCTGTCATTACATTCTCACTTTCCGGCGCTCAGGGTCGACCTGATTCACAGTATTAGGTCCACTTTTAACCAACTCAGTAAACTCTTGGCGAAATCTGAGAGGACTGAATTAAATAGCGACCAGCTATTGGAGCCCTTCAAGAATATAAATGTTTGGATATACAATGGCCACAACCAAATGTGGGAAAATGCAGTTTCAAGATTTTCGTCAAGTATCCGTCCAGCTGAAGCGAAGATAGCCGAGAAACTCAAACCGCGGCTACAGAATTTATCCACCAAGCAGTCCCTGTACGAGTTCTCAAGATACCGCACCTTGCTCAGTCGACCGCTAGTGCAGCAAGCTCTGACCCGAGAGCTGGAACTATTCCTGTCGTCGCTACTGACGATGATGAAGGACGTTAAATCACACTTGGAGGAAGACCTGCCGGGGCTGTACCACCCGCCCGAGATGACAGACCTGGTCGTCAAGGTGCAGTGGGCGAGGCAGATGGAGGACAAGGTGCGGCGAACATGTCTCAACGCTACTGACACTGCACAAACTGTATCATGA

Protein sequence:

>DPOGS211960-PA
MSEIRAYISKATENFFNVPTLKLSESSEGVLIDFIHNPLVYLLQACASEQRQIMLYADVRVSANKSIIFYKTSAVELTGSDALNDLNIITLTTGAAESLYQIIRHVYTPMLTIGDDLFSIKLQKTLLELESNLKLVTHGEGDENIKVILSVEDEVGYWKTFGEKRDIKKSEREAASAFCVLFEDICEEIRCLPSIGLQEVRDSAENIGGILDDVWRYSPTPYSQDRMVHIFDIVGHVICSVTQQAVSRTDLWRVHHGLKDNEILHQLTEALAAVKVWVSTCKTLTDTYWPNYSLHEWKGKPYVPVFCQNFQKRLEEIHSIRSTFNQLSKLLAKSERTELNSDQLLEPFKNINVWIYNGHNQMWENAVSRFSSSIRPAEAKIAEKLKPRLQNLSTKQSLYEFSRYRTLLSRPLVQQALTRELELFLSSLLTMMKDVKSHLEEDLPGLYHPPEMTDLVVKVQWARQMEDKVKEIESCVGTDLRNLEGSDEVLQLAAKVQNDLKNTYTQLYEEWSRDVQAQLRAGSLQLSERPVVEFSSADRLMVVNYPEGLERVEREARALLAAGLPPPPGALTGLTASLRYARALHQVASFHNTLGERAVSSTRPMLLHAALQLAALVADHRPPSWTDERALHEYTQQLKEKVMELEKQNNYLTSQHLKIRSIVEKLMDTELLAKLAEWKKGIKDIRDIIEKVEANGYENTEMWRSHWDLQLYKAMECQYMKALLSLHSHFPALRVDLIHSIRSTFNQLSKLLAKSERTELNSDQLLEPFKNINVWIYNGHNQMWENAVSRFSSSIRPAEAKIAEKLKPRLQNLSTKQSLYEFSRYRTLLSRPLVQQALTRELELFLSSLLTMMKDVKSHLEEDLPGLYHPPEMTDLVVKVQWARQMEDKVRRTCLNATDTAQTVS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: