सवाल "कैरिज रिटर्न" जैसे विशेष पात्र क्यों हैं "^ एम" के रूप में प्रतिनिधित्व करते हैं?


यही वजह है कि ^M वीआईएम और अन्य संदर्भों में कैरिज रिटर्न का प्रतिनिधित्व करने के लिए प्रयोग किया जाता है? 

मेरा अनुमान है कि M लैटिन वर्णमाला का 13 वां पत्र है और एक कैरिज रिटर्न है \x0D या दशमलव 13। क्या यही कारण है? क्या यह प्रतिनिधित्व कहीं भी दस्तावेज है?

मुझे पता है कि टैब का प्रतिनिधित्व किया जाता है ^I, जो लैटिन वर्णमाला का नौवां अक्षर है। इसके विपरीत, टैब है \x09 या दशमलव 9, जो उपरोक्त वर्णित मेरे सिद्धांत का समर्थन करता है। हालांकि, यह वास्तव में कहां से दस्तावेज किया जा सकता है?


91
2018-06-05 08:31


मूल


यह भी ध्यान रखें कि डॉस / विंडोज़ "0x0d 0x0a" का उपयोग करते हैं, जिसे "सीआर एलएफ" भी कहा जाता है। लेकिन यूनिक्स / लिनक्स केवल "0x0a" या "एलएफ" का उपयोग करते हैं। तो जब आप लिनक्स में एक विंडोज दस्तावेज़ खोलते हैं तो यह अतिरिक्त "सीआर" का पता लगाता है, और जब आप विंडोज़ में लिनक्स दस्तावेज़ खोलते हैं तो यह नई लाइनों का पता नहीं लगाता है। - LatinSuD
@LatinSuD कैरेट नोटेशन (और Ctrl-key का इसी प्रकार का उपयोग) सी 0 नियंत्रण सेट (ऐतिहासिक रूप से एएससीआईआई का हिस्सा) से संबंधित है और यह नहीं कि कैसे एक और ऑपरेटिंग सिस्टम या प्रोग्राम नई लाइनों का प्रतिनिधित्व करने में उस सेट का हिस्सा उपयोग करता है या कुछ भी अन्य। इसी प्रकार, चाहे ^Hएक चरित्र हटा देता है या ओवरप्रिंटिंग की अनुमति देता है (जैसे n^H~ ñ) या किसी अन्य वास्तविक उत्पादन के लिए एक अप्रचलित तरीका के रूप में उपयोग नियंत्रण चरित्र का ध्यान देखभाल नोटेशन से अलग है। - Jon Hanna
पुराना एक ... मुझे मूल कोड याद नहीं है, लेकिन ctrl-g घंटी बजती है! - Brian Drummond
@ ओलिवियर डुलैक नो, ^ एम है बिल्कुल कैरिज रिटर्न, जैसे कि ^ जे बिल्कुल एक लाइन-फीड है। जबकि विभिन्न ओएस के पास अलग-अलग विचार हैं कि लाइन-फीड और / या कैरिज रिटर्न या कुछ और (जैसे कि कुछ आईबीएम अक्षरों द्वारा उपयोग किए जाने वाले न्यूलाइन चरित्र की तरह, लेकिन एएससीआईआई का हिस्सा नहीं है और इसलिए कुछ अन्य ओएस की ऐतिहासिक विरासत का हिस्सा नहीं है) टेक्स्ट फ़ाइल में एक नई लाइन का प्रतिनिधित्व करते हैं, और कुछ कार्यक्रमों ने तब ओवरराइड किया है कि विभिन्न तरीकों से, यू + 000 डी स्वयं अभी भी एक कैरिज रिटर्न है, जो भी बाद में यूनिक्स या डॉस जैसे ऑपरेटिंग सिस्टम ने इसका फैसला किया। (बेशक, इसे बुला रहा है ... - Jon Hanna
@OlivierDulac ... यू + 000 डी प्रक्षेपित है, क्योंकि यह नाम 1 99 0 के दशक में यूनिकोड के साथ आया था, लेकिन यह 1 9 63 में एएससीआईआई में मौजूद कोड के रूप में निश्चित रूप से संदर्भित करता है, क्योंकि एएफएफ के रूप में यह 1 9 01 में मुरे के संशोधित बाउडोट कोड में मौजूद था मरे कई दशकों बाद "पाठ फ़ाइल" की अवधारणा में उपयोग किए जाने वाले वही औजारों के साथ चलते पेपर से संबंधित समस्याओं को हल कर रहा था। एक नाखून की तरह कुछ में एक पेंच हथौड़ा, और यह अभी भी एक पेंच है। टेक्स्ट फ़ाइल में किसी लाइन के अंत का प्रतिनिधित्व करने के लिए एलएफ और / या सीआर का उपयोग करें, और वे अभी भी लाइन-फीड और कैरिज रिटर्न हैं। - Jon Hanna


जवाब:


मेरा मानना ​​है कि वास्तव में क्या ओपी पूछ रहा था कैरेट नोटेशन

कैरेट नोटेशन ASCII एन्कोडिंग में अप्रतिबंधित नियंत्रण वर्णों के लिए एक संकेत है। इस नोटेशन में एक कैरेट (^) होता है जिसके बाद पूंजी पत्र होता है; यह digraph एएससीआईआई कोड के लिए खड़ा है जिसमें संख्यात्मक मूल्य अक्षर के संख्यात्मक मान के बराबर है। उदाहरण के लिए 4 के मान वाले ईओटी चरित्र को ^ डी के रूप में दर्शाया गया है क्योंकि डी वर्णमाला में चौथा अक्षर है। 0 के मान वाले एनयूएल चरित्र को ^ @ (@ ए से पहले ASCII वर्ण है) के रूप में दर्शाया गया है। मूल्य 127 के साथ DEL वर्ण को आमतौर पर ^ ?, के रूप में दर्शाया जाता है, क्योंकि ASCII '?' '@' और -1 से पहले 127 के समान होता है यदि 7 बिट्स पर मुखौटा होता है। अनुवाद का एक वैकल्पिक सूत्र यह है कि मुद्रित चरित्र ASCII कोड के 7 वें बिट को बदलकर पाया जाता है

देखभाल नोटेशन के साथ ASCII नियंत्रण पात्रों की पूरी सूची मिल सकती है यहाँ

विम और अन्य टेक्स्ट संपादकों के संबंध में: आप आम तौर पर केवल ^ एम देखेंगे यदि आप एक संपादक में एक विंडोज-स्वरूपित (सीआरएलएफ) टेक्स्ट फ़ाइल खोलते हैं जो लिनक्स लाइन एंडिंग्स (एलएफ) की अपेक्षा करता है। 0x0A को लाइन ब्रेक के रूप में प्रस्तुत किया जाता है, 0x0D ठीक से ^ एम के रूप में मुद्रित होने से पहले। अधिकांश समय, संपादक डिफ़ॉल्ट सेटिंग्स में 'स्वचालित रूप से रेखा समाप्ति को पहचानना' शामिल है।


114
2018-06-05 09:12



मैंने हमेशा सोचा कि उस चीज़ को क्या कहा गया था ... - smci
यह सम्मेलन कम से कम 1 9 70 के दशक में वापस चला जाता है; मैंने इसे पहली बार TOPS-10 ऑपरेटिंग सिस्टम पर देखा लेकिन यह पहले से मौजूद हो सकता है। पुराने एएससीआईआई टर्मिनल पर जो पात्र है, उसके लिए चरित्र अब एक कैरेट के रूप में दिखाया गया था, वास्तव में ऊपर की ओर इशारा करते हुए तीर था, इसलिए यह "अपार्रो नोटेशन" के रूप में उभरा। - keshlam
यह स्पष्ट रूप से ASCII डिज़ाइन में बनाया गया है ताकि Ctrl कुंजी बस बिट 7 को टॉगल कर दे। - OrangeDog
यह केवल अक्षरों के साथ प्रयोग नहीं किया जाता है। मैं इसे "अक्षर का संख्यात्मक मूल्य" के साथ नियंत्रण चरित्र के रूप में परिभाषित नहीं करता बल्कि "xor 64" के रूप में परिभाषित करता हूं। दूसरे शब्दों में, ^A है 0x41 xor 0x40, या 0x01 तथा ^? है 0x3F xor 0x40, या 0x7F। - R..
Ascii DEL (^?) के पास डिलीट कुंजी से कोई लेना देना नहीं है। यह वास्तव में मानक कोड उत्पन्न होता है <--- VT100- जैसे टर्मिनल पर कुंजी (भी, भ्रमित रूप से, बैकस्पेस कहा जाता है)। - R..


यही कारण है।

एएससीआईआई अक्षरों 0-31 को गैर-प्रिंटिंग नियंत्रण कोड के रूप में परिभाषित करता है। यहां से एक निकास है ascii(7) एक यादृच्छिक लिनक्स सिस्टम से मैनुअल पेज (man ascii), सीआर (13) तक और सहित:

   Oct   Dec   Hex   Char                       
   ─────────────────────────────────────────────
   000   0     00    NUL '\0'                    
   001   1     01    SOH (start of heading)     
   002   2     02    STX (start of text)         
   003   3     03    ETX (end of text)           
   004   4     04    EOT (end of transmission)   
   005   5     05    ENQ (enquiry)               
   006   6     06    ACK (acknowledge)           
   007   7     07    BEL '\a' (bell)             
   010   8     08    BS  '\b' (backspace)       
   011   9     09    HT  '\t' (horizontal tab)  
   012   10    0A    LF  '\n' (new line)        
   013   11    0B    VT  '\v' (vertical tab)    
   014   12    0C    FF  '\f' (form feed)       
   015   13    0D    CR  '\r' (carriage ret)    

परंपरागत रूप से इन पात्रों के साथ उत्पन्न होते हैं नियंत्रण और चरित्र से संबंधित पत्र आवश्यक है। Teletypes और प्रारंभिक टर्मिनल कीबोर्ड के ऊपर लिखा 'बेल' था जी इस कारण के लिए कुंजी।

मानक दस्तावेज जिसे एएससीआईआई परिभाषित किया गया है एएसए एक्स 3.4-19 63, जिसे 1 9 63 में अमेरिकन स्टैंडर्ड एसोसिएशन द्वारा प्रकाशित किया गया था। मुझे मूल वेबसाइट को उनकी वेबसाइट पर नहीं मिल रहा है, लेकिन मूल दस्तावेज़ से यह निकालें उपरोक्त नियंत्रण कोड सहित चरित्र तालिका दिखाता है।


22
2018-06-05 08:38



धन्यवाद। हालांकि जानकारीपूर्ण, इस जवाब में प्रश्न का उत्तर नहीं है। - dotancohen
उत्तर दूसरे पैराग्राफ में छिपा हुआ है: ^M नियंत्रण-एम के लिए शॉर्टेंड है। टर्मिनल पर आप एएससीआईआई कोड 0x0D को कैरिज रिटर्न के रूप में भी जाने के लिए एम कुंजी के साथ कंट्रोल कुंजी दबाएंगे। - Martin Liversage


नोटेशन जल्द से जल्द ASCII Teletypes (सीए 1 9 63) में जाता है। एक सीटीआरएल कुंजी थी जिसने 0x40 बिट को टॉगल किया ताकि सीटीआरएल-एम (कैरिज रिटर्न) 4 डी के बजाय 0 डी होगा, सीटीआरएल-जी (घंटी) 47 की बजाय 07 होगी, CTRL-L (फॉर्म फीड) इसके बजाय 0 सी होगा 4 सी के।

विशेष कार्यों को विशेष पत्र निर्दिष्ट करने में कोई "डिज़ाइन" नहीं था, यह केवल मौका था कि जब धूल ASCII कोड निर्दिष्ट करने से बसा था, एम कुंजी कैरिज रिटर्न से थोड़ा अलग था और इसलिए कैरिज रिटर्न CTRL-M बन गया।

एएसआर 33 कीबोर्ड के बारे में मुझे सबसे अच्छा शॉट मिल सकता है। जैसा कि आप देख सकते हैं कि नियंत्रण वर्ण नाम संबंधित अल्फा कुंजी पर छोटे अक्षरों में मुद्रित होते हैं।

Teletype Model 33 ASR with paper tape punch/reader

छवि मार्सीन विचरी द्वारा, उपयोगकर्ता: एलनएम 1 (व्युत्पन्न (फसल) से फ़ाइल: एएसआर -33 2.jpg) [सीसी BY 2.0], विकिमीडिया कॉमन्स के माध्यम से

एम कुंजी पर इस पर कोई संकेत नहीं है क्योंकि एक समर्पित "वापसी" कुंजी है, इसलिए CTRL-M अनावश्यक है।


13
2018-06-06 22:01



कुछ स्तर पर जिस सीमा तक हम अभी भी प्राचीन प्रणालियों की तरह लगने वाले डिजाइन विकल्पों से बंधे हैं, आश्चर्यजनक है - मुझे लगता है कि (ए) यह बहुत समय पहले नहीं है, यह केवल अंतरिम में परिवर्तन की गति है आश्चर्यजनक रहा है, और (बी) यदि पर्याप्त डिजाइन निर्णय किए जाते हैं, तो उनमें से कुछ (विशेष रूप से जो लोग पर्याप्त समस्याएं नहीं पैदा करते हैं) उनके स्मृति के गायब होने के कारणों के बाद लंबे समय तक चिपकने के लिए बाध्य हैं। हालांकि इन चीजों में से कुछ के इतिहास पर वापस देखने के लिए अभी भी एक अजीब लग रहा है। - Stuart Golodetz
@StuartGolodetz - असल में, मुझे यह आश्चर्यजनक रूप से आश्वस्त लगता है। लेकिन तब मुझे याद है जब टेलेटिप "उन्नत तकनीक" थीं। (टेलीलेट एएसआर -33, वैसे, इसकी सुरुचिपूर्ण सादगी के लिए उल्लेखनीय था। मैं केवल यही चाहता हूं कि "आधुनिक" कंप्यूटर सिस्टम अच्छी तरह डिज़ाइन किए गए हों।) - Daniel R Hicks
यह आकर्षक है लेकिन जो मुझे समझ में नहीं आता है .. क्यों उन्होंने सभी चीजों का फैसला किया कि इस टाइपराइटर को घंटी की आवश्यकता है? - CaptainCodeman
@CaptainCodeman - जब आप एक महत्वपूर्ण संदेश प्रसारित करते हैं तो आप दूसरे छोर पर ऑपरेटर का ध्यान पाने के लिए घंटी बजते हैं। - Daniel R Hicks
यह ध्यान रखना दिलचस्प है कि पीसी कुंजी पर इस दिन Ctrl कुंजी जीवित रहती है। - Daniel R Hicks


देखभाल (^) नियंत्रण कुंजी को पकड़ने के लिए सिर्फ लघुरूप है - CTRL नीचे।

अच्छे पुराने दिनों में आप इन कोडों को ऊपर (ऊपर देखें) टाइप कर सकते हैं, Ctrl कुंजी + जी (^ जी) टर्मिनल को "डिंग"

जब आप विम में एक सीआर जोड़ना चाहते हैं तो आप Ctrl कुंजी + एम आदि टैब = Ctrl + I का उपयोग करते हैं


2
2018-06-06 14:32



जिस शब्द को आप ढूंढ रहे हैं वह है संयुक्ताक्षर, जिसका अर्थ है दो वर्ण जो एक चरित्र का प्रतिनिधित्व करते हैं। विशेष रूप से, गैर-मुद्रित वर्णों का प्रतिनिधित्व करने के लिए डिग्राफ और ट्रिग्राफ का उपयोग किया जाता है। ऐतिहासिक रूप से वे उन पात्रों के लिए भी उपयोग किए जाते हैं जो कीबोर्ड पर दिखाई नहीं देते हैं, हालांकि आधुनिक जीयूआई और कीबोर्ड के साथ यह एक मुद्दा कम है, इसलिए यह उपयोग अधिक पुरातन है।
"अच्छे पुराने दिनों में" आज भी है, ^ सी और ^ डी पूरी तरह कार्यात्मक है। एकमात्र कारण यह है कि ^ जी टर्मिनल डिंग नहीं करता है यह है कि अधिकांश टर्मिनल अनुकरणकर्ताओं ने उस प्रतिक्रिया को बंद कर दिया है। - SevenSidedDie


परिभाषा गैर-प्रिंट करने योग्य पात्रों के अनुसार प्रदर्शित करने के कुछ दृश्य तरीके की आवश्यकता है।

तो, 1 9 70 के दशक के शुरू में (या शायद पहले) (मुझे इसे सीपी / एम पर देखकर याद है, और किसी और ने पहले से ही टीओपीएस का उल्लेख किया है) ने फैसला किया कि "कैरेट प्लस लेटर" मूल्यों के साथ 26 अप्रशिक्षित ASCII नियंत्रण वर्णों का प्रतीक होगा 1 से 26. मूल्य 0 को ^ @ के रूप में मुद्रित किया गया था, और मूल्य 127 के रूप में ^ ?.


2
2018-06-09 00:51





यह कहां दस्तावेज किया गया है, अच्छी तरह से यह पृष्ठ प्रत्येक नियंत्रण चरित्र को सूचीबद्ध करता है, जिसमें नियंत्रण कुंजी के साथ इसे दर्ज / प्रस्तुत करने के तरीके (हालांकि पहला, एएससीआई चरित्र 0, कोई नियंत्रण कुंजी प्रतिनिधित्व नहीं है), और इसमें चरित्र 127 के लिए कुछ भी नहीं है। और यह नीचे स्रोत प्रदान करता है

https://www.cs.tut.fi/~jkorpela/chars/c0.html

कोई आश्चर्यचकित हो सकता है कि 33 नियंत्रण वर्ण हैं (ASCII वर्ण 0-31 तो 32 गुण, + वर्ण 127. इसलिए, = 33 वर्ण) वर्णमाला में केवल 26 अक्षरों के रूप में उनका प्रतिनिधित्व कैसे किया जाएगा। खैर, यह एएससीआई चरित्र 1 के लिए एएससीआई चरित्र 1, Ctrl-Z के लिए Ctrl-A का उपयोग करता है, और एक बार जब यह Ctrl-Z तक पहुंच जाता है, तो यह उपयोग करता है [  \  ]  ^  _ 

यह एसयूबी के रूप में Ctrl-Z सूचीबद्ध करता है, हालांकि डॉस में और cmd प्रॉम्प्ट यह ईओएफ है, और एक तकनीकी उपयोगकर्ता के रूप में आप इसे करते समय इसका उपयोग करते हैं copy con a.a कहा पे a.a आपकी फाइल है आप टेक्स्ट दर्ज करते हैं और इसे Ctrl-Z के साथ समाप्त करते हैं जो मजेदार रूप से पर्याप्त है EOF मार्कर में प्रवेश नहीं करता है। लेकिन सीएमडी को बताता है कि फाइल का अंत है इसलिए सीएमडी इसे लिखता है।

वह cs.tut.fi वेबपृष्ठ इसे स्रोत के रूप में देता है
http://www.wps.com/texts/codes/X3.4-1963/index.html

लेकिन यह एक टूटी हुई लिंक है, लेकिन archive.org पर उपलब्ध है यह जेपीजी के रूप में है

आदान प्रदान के लिएअमेरिकन मानक कोड सूचना
एएसए मानक एक्स 3.4-19 63

https://web.archive.org/web/20010430085116/http://www.wps.com/texts/codes/X3.4-1963/index.html


1
2018-06-05 18:25



अधिकांश नियंत्रण वर्ण व्यर्थ हैं, लेकिन उनमें से कुछ को Ctrl-I जैसे अर्थ भी हैं, मुझे यकीन नहीं है कि आप केवल Ctrl-I कर सकते हैं और एक टैब प्राप्त कर सकते हैं। - barlop
नियंत्रण कक्षों में से कोई भी अर्थहीन नहीं है। उनमें से कई कई संदर्भों में अप्रयुक्त हैं, लेकिन प्रत्येक के पास कम से कम एक अर्थ है। - Jon Hanna
@ जोनहन्ना बेशक मेरा मतलब यह नहीं है कि वे व्यर्थ थे (भूतकाल)। लेकिन आर। दशकों से अर्थहीन था यानी उनके पहले अर्थों से पहले का अर्थ था, तकनीक जो अब नहीं चलती है, आज (अधिकांश वर्ण) अर्थहीन हैं डब्ल्यू / वर्तमान और यहां तक ​​कि थोड़ा पुराना तकनीक। अगर किसी को आधुनिक उपयोग में रखा जा रहा है तो यह बहुत नहीं है। यहां एक सूची है en.wikipedia.org/wiki/Control_character  सामान्य उपयोग में से 0,7,8,9,10,11,12,13,127। 9/33 इसलिए अन्य (उनमें से 24) आप या तो बहुत ही कम या नहीं करेंगे क्योंकि वे दशकों तक मशीनरी के इस्तेमाल से बाहर निकलने वाले एंटीक के रूप में मर चुके हैं, - barlop
एसोसिएटेड प्रेस अभी भी एएनपीए -1312 का उपयोग करती है जो प्रत्येक टीसीपी / आईपी कनेक्शन शुरू करने के लिए 1-4, 6 और 16 का उपयोग करती है। आधुनिक प्रिंटर (अन्य थिगनों के बीच) अभी भी 17 और 1 9 का उपयोग करते हैं। जिनके साथ आप उल्लेख करते हैं, उनके साथ उनमें से एक प्रतिशत वास्तव में कोशिश किए बिना कवर किया गया है। मैं आपको दूंगा कि वे अंदर नहीं हैं भारी उपयोग करें, लेकिन वे भी मर नहीं है। - Jon Hanna
@barlop आप कर सकते हैं ^I मानक बैश में एक टैब के लिए: टाइप करें ls ~/^I^I और आपको अपनी होम निर्देशिका में सभी फ़ोल्डरों को देखना चाहिए। - wchargin


आप सभी गैर मूल्यवान ASCII वर्ण देख सकते हैं नियंत्रण मैपिंग इस तालिका।


0
2018-06-05 08:46



जबकि यह सैद्धांतिक रूप से सवाल का जवाब दे सकता है, यह बेहतर होगा यहां उत्तर के आवश्यक हिस्सों को शामिल करने के लिए, और संदर्भ के लिए लिंक प्रदान करें। इस तरह, लिंक किए गए पृष्ठ को कभी भी किसी भी कारण से बदलना या अमान्य होना चाहिए, उत्तर अभी भी सुपर उपयोगकर्ता के आगंतुकों के लिए उपयोगी होगा। - α CVn
धन्यवाद। हालांकि जानकारीपूर्ण, इस जवाब में प्रश्न का उत्तर नहीं है। - dotancohen