כיצד לקבוע את תוכן ה- GC של רצף DNA?
תוכן הגואנין-ציטוזין, או תוכן ה- GC, ברצף ה- DNA מציין את אחוז זוגות בסיס הנוקליאוטידים בהם קושר הגואנין לציטוזין. יהיה קשה יותר לפרק DNA עם תוכן GC גבוה יותר.
שיטה 1 מתוך 2: ביד
- 1עקוב אחר הרצף וציין את מספר הנוקלאוטידים של ציטוזין (C) או גואנין (G).
- 2חלק את מספר הציטוזינים והנוקלאוטידים הגואנינים במספר הזוגות הבסיסי ברצף.
שיטה 2 מתוך 2: באופן פרוגרמטי (פיתון 2)
- 1צור או קבל קובץ קלט. מאמר זה מניח שהקלט הוא בפורמט FASTA, עם רצף יחיד לכל קובץ.
- 2קרא בתיק. לפורמט FASTA:
- מחק את השורה הראשונה בקובץ.
- הסר את כל הקווים החדשים שנותרו ואת המרחב הלבן הנגרר האחר.
def init (רצף): עם open (argv [1]) כקלט: רצף = "". להצטרף ([line.strip () לשורה ב input.readlines () [1:]]) רצף החזרה
- 3צור דלפק. חזרו דרך הנתונים והגדלו את הדלפק שלכם כשאתם נתקלים בכל נוקלאוטידים של גואנין או ציטוזין.4
def GCcontent (רצף): GCcount = 0 לאות ברצף: אם אות == "G" או אות == "C": GCcount + = 1 חזרה GCcount
- 5חלק את ספירת ה- GC לפי האורך הכולל של הרצף, והפק את התוצאה בפורמט אחוז.6
def main (): script, input = argv רצף = "" רצף = init (רצף) הדפס "% 0,2f"% (float (GCcontent (רצף)) / len (רצף))
- אם אתה מחשב תוכן GC באופן ידני, הקפד לבדוק שוב! זה יכול להיות קל לספור לא נכון, במיוחד אם אתה מנתח רצף ארוך על הנייר.